假设我们想知道一个池塘里有多少鱼.有没有比捕到池塘里的所有鱼更简单的方法?
如果这些鱼有一些容易识别的特征, 比如种类.那么如果我们从池塘中随机捕获100条鱼, 我们可以假设100条捕获鱼的样本代表了池塘中所有鱼的种群.也就是说, 总体的特征应该以大致相同的比例出现在样本中.
如果我们捕获的100条鱼中有30条是大口黑鲈, 那么我们估计池塘中大约30% 的鱼是大口黑鲈.那么, 假设池塘中有300条大口黑鲈.这将让我们计算出池塘中所有鱼的数量:
但是, 如果我们尝试这种方法, 会有一个大问题:事实上, 我们不知道池塘里有多少大口黑鲈!虽然这种鱼的种类是一种很容易识别的特征, 但如果我们不知道具有这种特征的鱼的总数, 就没有多大用处.我们能不能给池塘里的一些鱼引入一个新的特性?
假设我们从池塘里随机捕获100条鱼, 在每条鱼上贴上标签, 然后把鱼放回池塘.如果我们让被标记的鱼与其他鱼混合, 然后捕获另一个随机样本, 那么这些鱼中的一些应该被标记了.如果我们捕到100条鱼, 其中20条都有标记, 就可以估计池塘中大约20%的鱼都有标签.
那么进一步我们能否知道池塘里总鱼群的数量呢?
如果我们把第二次捕到的鱼都贴上标签, 然后放了它们.在“第三次”捕到100条鱼的时候, 我们期望能找到多少条带标记的鱼?