1.误差和置信区间的关系
在测量、计算和观察过程中由于错误或者不可控因素的影响造成的变化偏离标准值或者规定值,这种误差是不可避免的,只要有估计,就会有误差,面对这种情况,我们会给予一个误差范围,在统计学中也叫置信区间。
2.置信水平的含义
置信水平为95%指的就是区间内包含总体平均值的概率为95%
构造置信区间
不同样本大小的抽样分布
3.大样本如何计算置信区间
3.1.确定要求解的问题
3.2.求样本的平均值和标准误差
3.3确定置信水平
现在我们可以来看一个简单的问题来了解下如何计算置信区间
假设有一组样本,调查的是男性的平均身高,样本大小为100人,样本平均值为167.1cm,样本标准差为0.2cm
1.样本大小大于30,符合正态分布,我们要通过样本的平均值来估计总体的平均值
2.标准误差公式
案例的标准误差为se=0.2/√100=0.02
3.确定置信水平
常用的置信水平为95%
4.求出置信区间上下限的值
a(左侧)=样本平均值-几个标准误差
b(右侧)=样本平均值+几个标准误差
这里的几个又被称为标准分,那么标准分如何计算呢?
这时候我们可以查询标准正态分布表,查询后对应的标准分z=-1.96
a=167.1-1.96*0.02=167.0608
b=167.1+1.96*0.02=167.1392
最后的得到的结果为:
置信水平95%,置信区间为[167.0608,167.1392]
4.小样本的置信区间如何计算
当样本大小小于30时,平均值的分布是符合t分布的,和正态分布类似,曲线较为扁平
t分布是由自由度df来定义的,自由度指样本中可以自由变动的变量的个数,当有约束条件时,自由度减少df=n-1(样本大小-1)
4.1确定要求的问题是什么
4.2求样本的平均值和标准误差
4.3查找t表格,求t值
4.4a=样本平均值-t*标准误差,b=样本平均值+t*标准误差
首先我们来看一个案例:注射药物A,10只小白鼠的平均反应时间为1.05秒,样本标准差为0.5秒
1.明确问题
我们需要求小白鼠反应时间的范围
2.样本的标准误差se=0.5/√10=0.158
3.查询t表格,找出对应的t值
4.a=1.05-2.262*0.158=0.692604
b=1.05+2.262*0.158=1.407396
结果置信水平95%,置信区间为[0.692604,1.407396]