Skip to main content

条件概率与三大公式

条件概率是概率论的核心概念——它描述了"在已知某事件发生的条件下,另一事件发生的概率"。全概率公式和贝叶斯公式是条件概率最重要的两个应用。

条件概率

定义

A,BA, B 为事件,P(B)>0P(B) > 0。已知 BB 发生的条件下 AA 发生的条件概率为:

P(AB)=P(AB)P(B)P(A \mid B) = \frac{P(AB)}{P(B)}

条件概率是概率

固定 BBP(B)>0P(B) > 0),P(B)P(\cdot \mid B) 满足概率的三条公理(非负性、规范性、可列可加性),因此它确实是一种概率。

乘法公式

由条件概率定义立得:

P(AB)=P(AB)P(B)=P(BA)P(A)P(AB) = P(A \mid B) \cdot P(B) = P(B \mid A) \cdot P(A)

推广(链式法则)

P(A1A2An)=P(A1)P(A2A1)P(A3A1A2)P(AnA1An1)P(A_1 A_2 \cdots A_n) = P(A_1) \cdot P(A_2 \mid A_1) \cdot P(A_3 \mid A_1 A_2) \cdots P(A_n \mid A_1 \cdots A_{n-1})

应用举例:无放回抽样

袋中有 aa 只白球,bb 只黑球,无放回抽取 kk 次,求第 ii 次抽到白球的概率。

用对称性可证,第 ii 次抽到白球的概率与第 1 次相同:aa+b\dfrac{a}{a+b}

全概率公式

核心思想:由因求果

将复杂事件按"互斥且穷尽"的原因拆解,分块加权求和。

公式

B1,B2,,BnB_1, B_2, \ldots, B_nΩ\Omega 的一个完备事件组(互不相交且并集为 Ω\Omega),且 P(Bi)>0P(B_i) > 0。则对任意事件 AA

P(A)=i=1nP(ABi)P(Bi)P(A) = \sum_{i=1}^{n} P(A \mid B_i) \cdot P(B_i)

应用举例:敏感性问题调查

在调查吸毒等敏感问题时,受试者随机抽取问题(无关问题/敏感问题),只需回答"是"或"否"。利用全概率公式,可从总体"是"的比例反推敏感问题的真实比例。

贝叶斯公式

核心思想:执果索因

已知结果 AA 已发生,反推是哪个"原因" BiB_i 导致的。

公式

P(BkA)=P(ABk)P(Bk)i=1nP(ABi)P(Bi)P(B_k \mid A) = \frac{P(A \mid B_k) \cdot P(B_k)}{\sum_{i=1}^{n} P(A \mid B_i) \cdot P(B_i)}

分子 = AABkB_k 同时发生的概率(由乘法公式)。分母 = P(A)P(A)(由全概率公式)。

贝叶斯术语

  • P(Bk)P(B_k)先验概率(试验前对各原因的相信程度)
  • P(ABk)P(A \mid B_k)似然(在原因 BkB_k 下观察到结果 AA 的可能性)
  • P(BkA)P(B_k \mid A)后验概率(观察到结果 AA 后,修正的对各原因的相信程度)

应用举例:疾病检测

疾病患病率 1%1\%,检测灵敏度 99%99\%,特异度 95%95\%。若某人检测呈阳性,他确实患病的概率是多少?

P(患病阳性)=0.99×0.010.99×0.01+0.05×0.9916.7%P(\text{患病} \mid \text{阳性}) = \frac{0.99 \times 0.01}{0.99 \times 0.01 + 0.05 \times 0.99} \approx 16.7\%

直觉反差:阳性检测结果的患病概率只有约 17%17\%,远低于人们直觉中的"99%99\% 准确"。这是因为患病率极低(万中有一),导致假阳性在阳性结果中占了绝大多数。

三大公式总结

公式方向用途
乘法公式从条件到联合将复杂概率拆解为条件概率的乘积
全概率公式由因求果通过各原因的概率加权求和求结果概率
贝叶斯公式执果索因观察到结果后,反推各原因的概率(更新信念)