(原标题:避免“小数定律”误导)
统计学有个重要的大数定律,又称“大数定理”、“大数法则”或“平均法则”。通俗地说,人们在长期的实践中发现,在随机现象的大量重复中往往出现几乎必然的规律,即对大样本取样的研究才可能得出规律性,大样本才可以反映总体。实际上,人们受到“小数定律”的影响,即在判断概率时根据经验判断事情发生的概率而忽略了样本的规模,认为小样本可以反映总体的观点。卡尼曼和特维尔斯基1974年的实验就证明了这一点。
实验案例,某城有两家医院,大医院每天约出生45个婴儿,小医院每天约出生15个婴儿。男孩出生率大约都为50%。但每天男孩的具体出生比例不同。每年,医院统计男孩出生率高于60%的天数,您认为哪家医院多一些?A,大医院;B,小医院;C,一样多。卡尼曼和特维尔斯基的实验结果表明,被试回答这三个问题时,21人认为大医院多,21人认为小医院多,53人认为一样多。
笔者做过多次研究,结论与此类似,共有1961人回答此问题,其中N(A)=417(21.3%);N(B)=601(30.6%);N(C)=943(48.1%)。
而概率理论告诉我们,小医院中这样的天数可能会多于大医院,这是因为样本越大(大医院),就越接近50% 这一平均值,而小医院样本小,则偏离50%这一平均值的可能性会更大。
抛1000次硬币出现正面500次和反面500次的概率与抛6次硬币出现正面3次和反面3次的概率是否一样?实验中有近40%的被试者认为一样,实际上不一样,前者是大样本,不大可能偏离平均值。后者是小样本,更可能偏离平均值。人们之所以会做出错误判断,是因为忽视了样本的大小。
实际上,小样本中偶然事件并不具有自我修正的功能,出现一个极高分也不一定出现相应的极低分与之平衡。余下的样本只是这个偶然事件进行“稀释”而不能“中和”,使其平均数接近总体的平均数。
人们之所以产生这样的判断错误,就在于他们认为任何一个小样本或者事件都应该具有全域的特征。
样本大小在统计学中非常重要,这是对问题进行准确判断的关键因素。但受到代表性偏误的影响,在面对抽样问题时,人们不仔细系统、理性思考时常常容易忽视样本大小。实践中,相比于大样本,极端的结果更容易出现在小样本中。
上一篇:3-5知识点:动量、动量守恒定律
下一篇:“垃圾人”定律