跳至主要内容

概率论悖论

· 阅读时间约 10 分钟

TLDR

本文探讨了概率论中三个令人着迷的悖论,这些悖论挑战了我们的直觉理解。首先,我们研究了蒙提霍尔问题,它展示了在游戏节目中换门如何反直觉地使你的获胜机会翻倍。接着,我们通过医学检测场景来探讨检验悖论,展示了当考虑基础概率时,即使高度准确的检测也可能导致误导性结论。最后,我们通过医院比较案例研究辛普森悖论,揭示了汇总统计数据有时可能呈现出与检查单个组成部分完全不同的情况。

蒙提霍尔问题

信息

假设你在一个游戏节目中,你面前有三扇门:一扇门后面是汽车;其他门后面是山羊。你选择了一扇门,比如 1 号门,然后主持人(他知道每扇门后面是什么)打开了另一扇门,比如 3 号门,里面有一只山羊。然后他对你说,"你想选择 2 号门吗?"换门对你有利吗?

你可能认为剩下的两扇门现在完全相同,获胜概率各为 1/2,但实际上,换门给你的获胜概率高达 2/3,而不换门只有 1/3 的概率。

在这个问题中,你可能认为两扇门之间没有区别;一扇门后面可能有山羊,而另一扇可能有汽车。无论你是否换门,概率都是 1/2。那么为什么实际上,换门给你赢得汽车的概率是 2/3,这是不换门概率的两倍呢?这里有一个容易被忽视的概念,就是概率论中的"基本事件"。想象你在掷一个六面骰子;掷出 1 的概率不等于不掷出 1 的概率。这是因为"不掷出 1"包括掷出 2、3、4、5 或 6 的结果——五种不同的结果,而"掷出 1"只包括一种结果。掷出特定数字的结果在这种情况下是"基本事件"。

在蒙提霍尔问题中,同样的概念适用,因为与两扇门相关的"基本事件"是不同的。在这个问题中,有三个基本事件:

  1. 汽车在 1 号门后面
  2. 汽车在 2 号门后面
  3. 汽车在 3 号门后面

这些事件中的每一个的概率都是相等的,都是 1/3。这三个基本事件可以分为两组:一组是你最初选择了正确的门,即事件 1,另一组是你最初选择了错误的门,包括事件 2 和 3。对于第一组,如果你选择换门,你将无法赢得汽车。对于第二组,如果你选择换门,你将赢得汽车(因为主持人总是会排除一个错误的选项,留下正确的那个)。因此,如果你坚持原门希望汽车在后面,你赢得汽车的概率只有 1/3。然而,如果你换门,赢得汽车的概率增加到 2/3。

如果这仍然不符合你的直觉,想象这个场景:你面前有 100 扇门。你选择了你的幸运数字,比如 66 号。主持人然后排除了 98 扇错误的门,只留下 25 号门和你的幸运数字 66 号门。现在,你会选择更换你的选择吗?一扇门是基于你的直觉选择的,而另一扇门是主持人排除了 98 扇门后剩下的选项。

检验悖论

信息

一家公司开发了一种创新的检测条,可以通过一个人的唾液检测早期癌症。这种检测条拥有令人印象深刻的 98%的准确率。这意味着无论最终检测结果是阳性(表明存在癌症)还是阴性(表明没有癌症),只有 2%的几率会出现误判。现在你已经使用了这种检测条并收到了阳性结果,你可能相信凭借其 98%的准确率,你肯定生病了。然而,事实上,真正患有癌症的概率只有约 15%。

人们常常直觉地认为,如果一项检测有 98%的准确率,那么检测呈阳性就意味着有 98%的可能性患有癌症。然而,这种推理包含了一个微妙的错误。实际上,患有癌症的人群是少数;人群中癌症的基础发病率只有约 1000 人中的 3 人。所以,不要忘记基本事件中有两个步骤:首先,从人群中随机选择一个人,然后测量他们的检测结果。 现在,如果你的检测呈阳性,这仅仅意味着你落入了图表中黄色背景部分的人群。真正患有癌症的概率是 31000981002.941000\frac{3}{1000} * \frac{98}{100} \approx \frac{2.94}{1000},而假阳性的概率是 9971000210019.941000\frac{997}{1000} * \frac{2}{100} \approx \frac{19.94}{1000}。没错,当你发现你的检测结果呈阳性时,这更有可能是因为非癌症人群中的假阳性,而不是癌症人群中的准确结果。因此,实际患有癌症的个体只占检测呈阳性者的 13%(2.942.94+19.9413%\frac{2.94}{2.94 + 19.94} \approx 13\%)。所以尽管检测条有 98%的准确率,但健康个体的庞大基数显著增加了假阳性的数量,导致最终检测结果的扭曲。

辛普森悖论

信息

在选择大医院和小医院时,一般假设是大医院有更专业的医生,更先进的设备,和更好的整体条件。确实,如果你分析任何特定部门,大医院的数据通常优于小医院。然而,如果你看整个医院所有患者的治疗成功率,你可能会发现大医院的总成功率只有 54%,而小医院却达到了 75%。这引发了一个问题:为什么在单个部门表现更好的大医院,整体治疗成功率却低于小医院?

要理解辛普森悖论,你只需要一张图片。在图片中,每个小点代表一个被治愈的疾病案例,每个点的颜色表示治疗该案例的部门。 当单独观察每个部门时,你会注意到随着医院规模的增加,被治愈的可能性也会增加。这符合我们的一般直觉,即较大的医院拥有更好的医疗专业知识和设施。 然而,当观察整体趋势时,你会发现随着医院规模的增加,被治愈的趋势实际上是下降的。仔细观察,你会注意到较大的医院往往有基础治愈率较低的部门,如红色点所示。这是因为在日常生活中,如果我们有简单的疾病如感冒或发烧,我们更喜欢去小医院,这意味着没有额外的旅行成本,几乎保证康复。但对于严重疾病,如癌症,我们必须去大医院,因为小医院没有能力处理这类疾病,而这类疾病通常很难治愈。这些数据导致了一个悖论性的结论,即总体而言,医院越大,被治愈的可能性越低,这实际上是一个误解。