本博文源于《商务统计》,主要探究理解估计量的三条评价标准,为后面的假设检验学习作出相应的铺垫。
估计量起源
我们一般会用样本的一些特性去描述总体的一些特性,以达到最好的估计。样本去估计整体的方法的好坏叫做估计量的好坏。如何评价呢?那就要引出估计量的三条标准:
- 无偏性
- 一致性(相合性)
- 有效性
三大特性逐一介绍
引例:某大学有2万名大学生,抽取两百名作为样本估计总体的月平均生活费用
无偏性
无偏性:就是估计出来的值就是处于整体的值的附近
理想中估计值的数学期望等于总体参数的数学期望
比如:同样连续从2w大学生抽取200名统计月平均生活消费,取得下列结果
第一次抽取200名:1820元
第二次抽取200名:1830元
第三次抽取200名:1825元
第四次抽取200名:1835元
第五次抽取200名:1826元
第六次抽取200名:1824元
这些抽取出来的结果应该是样本的平均值,然后我们对样本的平均值进行求和再求取平均就会发现,这时候产生的值应该等于总体的平均值才是正确的,这就叫做估计量的无偏性。
然后再去理解定义就明白了:
有效性
无偏估计只是能确定估计量在总体取值区间来回摆动,但是摆动范围大小需要确定,这时候引用方差概念。方差可以类比成估计量的有效性。
敲黑板:方差越小,越有效!
那就有不服气的小朋友问了?方差是什么?
答:x的取值与均值的累加平方和
那这些能告诉我什么呢?是不是难以摸出头脑?
就拿这种图来看吧,图中大家能清晰看到两种比较明显的抽样分布图,看出B这种图特别尖也就是特别陡,因此它的取值可以被理解成非常集中。非常集中它的一般取值跟均值的差的平方和就比A小,因此方差比较小,它的估计量就越有效。
一致性(相合性)
这个比上面更好理解,就是样本取值越大越好,符合我们熟悉理解的常理。一次发生可以说是偶然,屡次发生就叫做惯犯了。但一致性要有数学理论支撑,这在《概率论与数理统计》中有一个定律叫做切比雪夫大数定律。附图
透露出,只要样本足够大,就可以反映总体的变化。