目录:
- 什么是误差思维?
- 什么是置信区间
- 大样本如何计算置信区间
- 小样本如何计算置信区间
- 补充知识点
1、什么是误差思维?
在没办法得到总体数据的情况下,我们往往会用样本信息来估计总体信息,只要有估计,就会有误差,误差限定在一个范围之内。
在科学实验和数据分析中,总是会在测量结果上加一个误差范围,如马云的智商是100,误差范围是正负5,表示有正负5的统计误差,也就是马云的智商在100-5和100+5之间。真实的智商只有一个,但是数值是多少我们并不知道,它可以是这个误差范围内的任意一个数值。
误差范围在统计概率中被称为置信区间。
2、什么是置信区间
什么是置信区间?
置信区间:表示样本估计总体平均值范围的区间
统计学最基本的思想:用样本信息估计总体信息。
假如我们抽取了5个样本,5个样本的平均值在图中就是5个点(就是点估计),这5个点估计,我们无法分辨出哪个点估计是最好的,无法判断出准确程度,不知道误差范围。所以我们要用区间估计来解决点估计的这个问题,这个区间估计就是统计学中的置信空间,是一种区间估计的方法。
我们用95%置信水平来构造这个区间估计:
如果我们构造出100个这样的置信区间(100个样本),那么会有95个区间会包含这个总体平均值,置信水平是95%。置信水平:就是置信区间包含总体平均值的概率有多大。
置信区间(误差范围):[a,b] -&