在文章《武汉10天核酸检测1000万人?》中我们提到,
武汉之所以能在10天内完成千万人级的检测是由于采用了混样检测的方式,即将10个人的样本混合为1个样本池进行检测,若结果为阴性说明10个人中没有感染者,若结果为阳性则逐个再检测一次. 这样就可以大大减少总的检测次数. 而后我们通过考虑使最坏情况下的检测次数最小,利用基本不等式得到了数学上最优的分组方式.
当老君把上期文章分享到某学霸群,获得了以下反馈:
所以本期将从概率视角重新审视混样检测的问题.
概率模型
既然从期望角度看此问题,首先需要确定所要研究的随机变量. 而混样检测的总次数依赖于每个样本的性征,所以不妨设“每个样本的阳性与否”为相互独立的随机事件,那么不妨将"平均每个样本所消耗的检测次数"作为所要研究的随机变量
设被检测对象的核酸检测结果呈阳性的概率为
- 如果样本所在的样本池检测结果为阴性,那么该样本池中每个样本平均消耗的检测次数为
,而该随机事件可看作是k次独立重复随机试验(伯努利试验)的结果,故概率为 ; - 如果样本所在的样本池检测结果为阳性,那么该样本池中每个样本平均消耗的检测次数为
,而该随机事件同样可以看作是 次独立重复随机试验的结果,概率为 .
故
最优分组及灵敏度分析
利用计算机,通过枚举p的不同取值(0.0001~0.02),并分别求出对应的
进一步地,我们可以分别画出最优的
观察以上结果我们可以发现,随着
这意味着当
另外,最优分组的
本文最早于2020年5月29日发布于橘子数学公众号.