35.中心极限定理
大数定律揭示了大量随机变量的平均结果,但没有涉及到随机变量的分布的问题。而中心极限定理说是在一定条件下,给定一个任意分布的总体,我每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。 然后把这 m 组抽样分别求出平均值。 这些平均值的分布接近正态分布。
在实际生活当中,我们不能知道我们想要研究的对象的平均值,标准差之类的统计参数。中心极限定理在理论上保证了我们可以用只抽样一部分的方法,达到推测研究对象统计参数的目的。
40.置信区间
误差范围(区间)在统计概率里面就叫置信区间。
计算步骤:
-
确定要求解的问题是什么 比如我们想要通过样本来估计总体的平均值
-
求样本的平均值和标准误差 第3步:确定置信水平 常用的置信水平是95%,因为这样可以保证样本的平均值会落在总体平均值2个标准误差范围内
-
查找z表格,求z值 如果你的置信水平是图中的95%可以直接获取到对应的z值4.计算置信区间
a=样本平均值- z*标准误差
b=样本平均值 z*标准误差
T分布,当你拿到的数据样本不足30时,才会用到它。
大部分情况下,我们是可以获取到大于30的样本,这时候样本平均值是符合正态分布的
置信区间是我们所计算出的变量存在的范围,置信水平就是我们对于这个数值存在于我们计算出的这个范围的可信程度。 举例来讲,有百分之九十五的把握,真正的数值在我们所计算出的范围里。 在这里,百分之九十五九十置信水平,而我们计算出的范围,就是置信区间。
如果置信度为95%,抽样100次,得到100个置信区间,大约95个置信区间能覆盖到真实参数βk,实质就是随机区间。