随机非随意
概率破玄机
无序引有序
统计解迷离
- 严加安
现在有一种说法:抽烟会降低患老年痴呆的风险。为检验这一说法是否可信,设想某医疗机构在某个城市从65-75岁的人群中进行随机抽样调查了1000个人,分别统计抽烟者和非抽烟者老年痴呆症患病人数。结果显示:
250人是抽烟者,其中老年痴呆患者10人
750非抽烟者,其中老年痴呆患者45人
两类人中患老年痴呆症的比率分别是4%和6%,表面上看,差异显著,但是否能够根据这一差异来据此断定吸烟有助于预防老年痴呆症呢?
我们可以用统计学中的假设检验来回答这一问题,统计学知道,如果“吸烟不降低老年痴呆症患病率”这一假设乘以,如下定义的统计量将近似服从
∼(0,1)
:
其中 n1,n2 分别是抽烟者和非抽烟者的人数, p1,,p2 分别为抽烟者和非抽烟者患老年痴呆症比率, p 为两类人总体患老年痴呆症比率。
此时得
ξ≈1.2
,查表可知,
ξ≥1.2
的概率超过15%,这一结果还不足以否定“吸烟不降低老年痴呆症患病率”这一假设,如果将抽样人数扩大到4000人,假定两类人也相应地扩大4倍,而且患病率仍然分别是4%和6%,这时算得:
唯一变化的只有 n1,n2 ,此时 ξ≈2.4 ,查表可知, ξ≥2.4 的概率小于1%,此时我们有99%的把握断定抽烟能够降低老年痴呆症患病率了。
抽样调查的结论不仅要看统计数据(决定 p1,p2,p ),还要看样本量的大小 n1,n2,n