易错点强调:
什么是置信区间和置信水平?
置信区间?
95%置信区间应该这样理解:做100次相同的抽样,计算置信区间,那么你计算的区间内包含整体均值的概率是95%。置信区间描述的是随机抽样的可信度,说白了就是证明你抽样给出的结论为啥是靠谱的。
例如,我们有99%的几率相信,[48.8,64.8]的区间内包含了总体均值。
求解具体的步骤:
-
确定要求解的问题是什么
比如我们想要通过样本来估计总体的平均值 -
求样本的平均值和标准误差
注意:总体,样本,样本均值抽样分布是3个东西,一定要区分开。
计算样本均值 X ̅,样本方差(除于n-1)δ_X ̅
----------------某些时候可以近似为总体的均u和总体的方差(标准差)δ使用中间键——样本均值的抽样调查,
抽样后的均值=总体的均值,
标准差=总体地标准差/(抽样的数目n)^0.5
最后都是通过中间键的标准差=总体地标准差/(抽样的数目n)^0.5,
(查表Z表或者反推)标准差±多少个标准差
均值±多少个标准差 -
确定置信水平
常用的置信水平是95%,因为这样可以保证样本的平均值会落在总体平均值2个标准误差范围内 -
查找z表格,求z值
如果你的置信水平是图中的95%,可以直接获取到对应的z值 -
计算置信区间
A=样本平均值- z标准误差
b=样本平均值+ z标准误差
参考:
https://www.zhihu.com/question/24801731?sort=created
补充:
对比正态分布取n>=30,当n<30时,是t分布----查的是t表
基本于上面一样,但是查的表改变了,还有就是自由度是n-1