Bayes 公式

Bayes

贝叶斯(1701年—1761年,Thomas Bayes),英国数学家。1701 年出生于伦敦,做过神父。1742 年成为英国皇家学会会员。1761 年 4 月 7 日逝世。贝叶斯在数学方面主要研究概率论。他首先将归纳推理法用于概率论基础理论,并创立了贝叶斯统计理论,对于统计决策函数、统计推断、统计的估算等做出了贡献。1763 年由 Richard Price 整理发表了贝叶斯的成果 《An Essay towards solving a Problem in the Doctrine of Chances》,对于现代概率论和数理统计都有很重要的作用。贝叶斯的另一著作 《机会的学说概论》 发表于 1758 年。贝叶斯所采用的许多术语被沿用至今。

Bayes 公式

贝叶斯定理是关于随机事件 A 和 B 的条件概率(或边缘概率)的一则定理。其中 P(A|B) 是在 事件B 发生的情况下 事件 A 发生的可能性(概率)。

人们根据不确定性信息作出推理和决策需要对各种结论的概率作出估计,这类推理称为概率推理。概率推理既是概率学和逻辑学的研究对象,也是心理学的研究对象,但研究的角度是不同的。概率学和逻辑学研究的是客观概率推算的公式或规则;而心理学研究人们主观概率估计的认知加工过程规律。贝叶斯推理的问题是条件概率推理问题,这一领域的探讨对揭示人们对概率信息的认知加工过程与规律、指导人们进行有效的学习和判断决策都具有十分重要的理论意义和实践意义。

Bayes 公式应用

吸毒者检测

假设一个常规的检测结果的敏感度与可靠度均为 99%,也就是说,当被检者吸毒时,每次检测呈阳性 + 的概率为 99%。而被检者不吸毒时,每次检测呈阴性 + 的概率为 99%。从检测结果的概率来看,检测结果是比较准确的,但是贝叶斯定理却可以揭示一个潜在的问题。假设某公司将对其全体雇员进行一次吸食情况的检测,已知 0.5% 的雇员吸毒。我们想知道,每位医学检测呈阳性的雇员吸毒的概率有多高。令 D 为该公司雇员吸毒事件,N 为该公司雇员不吸毒事件,+ 为该公司雇员检测呈阳性事件。可得:

Bayes 公式变量统计
变量说明数值
P(D)雇员吸毒的概率(吸毒者 D 的先验概率)0.5%
P(N)雇员不吸毒的概率1-P(D)=99.5%
P(+|D)吸毒者阳性检出率(这是一个条件概率同时也是先验概率)99%(已知条件)
P(+|N)不吸毒者阳性检出率(出错检测的概率/误检率)1-99%(已知条件)=1%
P(+)不考虑其他因素的影响的阳性检出率(检测呈阳性 + 的先验概率)P(+) = P(+,D) + P(+,N) = P(+|D)P(D) + P(+|N)P(N)
P(D|+)检测呈阳性确认吸毒者的概率P(D|+) = P(+|D)P(D) / (P(+|D)P(D)+P(+|N)P(N))

P(+) = 吸毒者阳性检出率 P(D)P(+|D) (0.5% × 99% = 0.00495) + 不吸毒者阳性检出率 P(N)P(+|N) (99.5% × 1% = 0.00995) = 1.49%

P(D|+) = 0.99 * 0.005 / 0.0149 = 33.2215%

尽管检测结果可靠性很高,但是只能得出如下结论:如果某人检测呈阳性,那么此人是吸毒的概率只有大约 33%,也就是说此人不吸毒的可能性比较大。测试条件(本例中指D,雇员吸毒)越难发生,发生误判的可能性越大。

复检阳性为吸毒者概率:

Bayes 公式变量统计
变量说明数值
P(D)复检雇员吸毒的概率(复检雇员吸毒的先验概率)33.2215%
P(N)复检雇员不吸毒的概率1-P(D)=66.7785%
P(+|D)吸毒者阳性检出率(条件概率同时也是先验概率)99%(已知条件)
P(+|N)不吸毒者阳性检出率(出错检测的概率/误检率)1-99%(已知条件)=1%
P(+)不考虑其他因素的影响的阳性检出率(检测呈阳性 + 的先验概率)P(+) = P(+,D) + P(+,N) = P(+|D)P(D) + P(+|N)P(N)
P(D|+)检测呈阳性确认吸毒者的概率P(D|+) = P(+|D)P(D) / (P(+|D)P(D)+P(+|N)P(N))

P(+) = 吸毒者阳性检出率 P(D)P(+|D) (33.2215% × 99% = 0.3289) + 不吸毒者阳性检出率 P(N)P(+|N) (66.7785% × 1% = 0.0068) = 33.57%

P(D|+) = P(D)P(+|D)/P(+) = 33.2215% * 99% / 33.57% = 97.97%