poster347

混样检测平均情况再探讨

如何用数学计算最优的分组方式?
混样检测平均情况再探讨
8 人挑战成功
趣味数学挑战

完成本期挑战需要达到:

高中数学水平

题目

武汉市于2020年5月14日~5月23日开展了全员新冠病毒核酸筛查“十天大会战”. 在此之前,有关部门就已经通过随机抽样的方式对全武汉100个社区的11423名居民进行了核酸检测,结果只有人的检测结果呈阳性. 专家由此分析认为武汉人口中无症状感染者的实际占比不足. 据人口数据统计,预计参与这次检测的人数将超过900万人.而武汉的单日检测能力为万样本/天. 故专家建议采取混样检测的方式进行筛查,即将多份样本混合为一个样本池进行检测,若检测结果为阴性则说明样本池中没有感染者,若为阳性则再进行逐一筛查.

假设每个样本检测为阳性的概率为,且每个样本的检测结果相互独立. 若将个样本混为个样本池,以武汉万样本每日的检测能力,__________满足“十天大会战”的需求.

选项

在文章《武汉10天核酸检测1000万人?》中我们提到,

武汉之所以能在10天内完成千万人级的检测是由于采用了混样检测的方式,即将10个人的样本混合为1个样本池进行检测,若结果为阴性说明10个人中没有感染者,若结果为阳性则逐个再检测一次. 这样就可以大大减少总的检测次数. 而后我们通过考虑使最坏情况下的检测次数最小,利用基本不等式得到了数学上最优的分组方式.

当老君把上期文章分享到某学霸群,获得了以下反馈:

image

所以本期将从概率视角重新审视混样检测的问题.

概率模型

既然从期望角度看此问题,首先需要确定所要研究的随机变量. 而混样检测的总次数依赖于每个样本的性征,所以不妨设“每个样本的阳性与否”为相互独立的随机事件,那么不妨将"平均每个样本所消耗的检测次数"作为所要研究的随机变量.

设被检测对象的核酸检测结果呈阳性的概率为,每份样本池混合个样本,则有:

  1. 如果样本所在的样本池检测结果为阴性,那么该样本池中每个样本平均消耗的检测次数为,而该随机事件可看作是k次独立重复随机试验(伯努利试验)的结果,故概率为;
  2. 如果样本所在的样本池检测结果为阳性,那么该样本池中每个样本平均消耗的检测次数为,而该随机事件同样可以看作是次独立重复随机试验的结果,概率为.

最优分组及灵敏度分析

利用计算机,通过枚举p的不同取值(0.0001~0.02),并分别求出对应的的最小值,我们得到的结果如下:

image

进一步地,我们可以分别画出最优的关于的曲线:

image

image

观察以上结果我们可以发现,随着的增大,所对应最优分组的值随之减少,从100.5多开始迅速下降且下降的速率逐渐趋缓. 所对应最优分组的随之增大, 与近似呈线性关系.

这意味着当较大(目测小于0.5%)时,最优分组的值对的变化极为敏感.

另外,最优分组的呈线性关系意味着,用混样检测方式相比逐个检测所获得优势随着增大而逐渐减弱.

本文最早于2020年5月29日发布于橘子数学公众号.

1

发布于3 年前
慕容玖
level4
展开所有评论
发表评论