7个高血压患者服用新药3个月后,血压分别上升了1.5,2.9,0.9,3.9,3.2,2.1,1.9.要求计算所有病人血压上升值的期望在95%的置信区间。
分析:这是一个生物过程,生物过程是正态分布的,也就是说总体的分布是一个正态分布。一般情况下,是依据样本的均值和标准差。用样本的标准差来估计总体标准差。但是对于这个例子来说样本容量n=7,太小。通常情况下,n≥30才算是好的估计,如果n<30就不是好的估计。
若总体为未知的非正态分布时,只要样本容量 n足够大(通常要求n ≥30),样本均值仍会接近正态分布。样本分布的期望值为总体均值,样本方差为总体方差的1/n 。这就是统计上著名的中心极限定理。该定理可以表述为:从均值为μ、方差为σ^2(有限)的总体中,抽取样本量为n的随机样本,当n充分大时(通常要求n ≥30),样本均值的分布近似服从均值为μ ,方差为σ^2/n 的正态分布。
如果总体不是正态分布,当n为小样本时(通常n<30),样本均值的分布则不服从正态分布,服从t分布。
t分布是更合适于小样本容量时置信区间的估计。利用下图公式来计算。
此处样本均值=2.34,s=1.04,样本均值的标准差=0.39,n=7.1-α=0.95,α/2=0.025.查找下图t分布表,找0.025与6的交汇处得到2.447.u的置信区间是(2.34-0.39x2.447,2.34+0.39x2.447)