数据分析------统计学----小样本容量置信区间例题

该博客通过一个实例探讨了在7名高血压患者服用新药后血压上升值的统计分析。由于样本容量n=7较小,不满足正态分布的估计条件,因此使用t分布来计算95%置信区间。经过计算,得到血压上升值的置信区间为(2.34-0.39x2.447, 2.34+0.39x2.447)。" 103038426,275413,VMware中安装与配置CentOS8详解,"['VMware', 'Linux', 'CentOS', '网络配置']
摘要由CSDN通过智能技术生成

7个高血压患者服用新药3个月后,血压分别上升了1.5,2.9,0.9,3.9,3.2,2.1,1.9.要求计算所有病人血压上升值的期望在95%的置信区间。


分析:这是一个生物过程,生物过程是正态分布的,也就是说总体的分布是一个正态分布。一般情况下,是依据样本的均值和标准差。用样本的标准差来估计总体标准差。但是对于这个例子来说样本容量n=7,太小。通常情况下,n≥30才算是好的估计,如果n<30就不是好的估计。

若总体为未知的非正态分布时,只要样本容量 n足够大(通常要求n ≥30),样本均值仍会接近正态分布。样本分布的期望值为总体均值,样本方差为总体方差的1/n 。这就是统计上著名的中心极限定理。该定理可以表述为:从均值为μ、方差为σ^2(有限)的总体中,抽取样本量为n的随机样本,当n充分大时(通常要求n ≥30),样本均值的分布近似服从均值为μ ,方差为σ^2/n 的正态分布。

如果总体不是正态分布,当n为小样本时(通常n<30),样本均值的分布则不服从正态分布,服从t分布。


t分布是更合适于小样本容量时置信区间的估计。利用下图公式来计算。

此处样本均值=2.34,s=1.04,样本均值的标准差=0.39,n=7.1-α=0.95,α/2=0.025.查找下图t分布表,找0.025与6的交汇处得到2.447.u的置信区间是(2.34-0.39x2.447,2.34+0.39x2.447)

 

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值