一、置信区间与置信水平
在做实验时,即使实验条件再准确,也无法避免随机干扰的影响,所以误差永远存在,无可避免。做科学实验时要测量多次,采取取平均值的方法。在科学实验的测量结果上,总是会加上一个测量范围。
统计学核心思想:用样本信息来估计总体信息
之前我们用样本给出一个精确值来估计总体,这个点估计值是有价值的,但可能存在误差,因为有估计就会有误差,误差不可避免但是可以减少。
点(精确值)误差 > 区间(范围)误差
点估计
图中横轴是不同样本的平均值从小到大,红色虚线表示要求的总体平均值,假设将抽样的过程重复5次,那么就有了5个样本,可以算出5个样本平均值的点估计,也就是蓝色的点代表总体样本。
如果图中有许多蓝色的点,每一个蓝色的点都是对总体平均值的一次点估计,这么多点估计,我们是分辨不出那个点估计更好的,也就是说,我们无法知道估计的准确程度是多少,反过来说,我们是不知道误差范围的,为了解决点估计存在的问题,需要运用区间估计。
假如想要知道全国男性的平均身高,这只能通过抽样的方法,用样本信息估计出总体信息,从全国成年男性中随机抽取一个样本,这个样本的平均值就是对总体平均值的一次点估计,当有多个样本时具有多个点估计,由于无法判别那个点估计对总体估计的误差范围更小,所以要用区间估计来解决这个问题。
比如说,全国成年男性的平均身高在165cm~17