本章讨论简单随机抽样和分层随机抽样下比率估计和回归估 计的构造及性质。要求:
①掌握总体比率、比率估计量及回归估计量的概念。
②了解比率估计量、回归估计量的偏倚、方差及方差的估计量。
③掌握应用比率估计量及回归估计量的条件。
抽样调查从本质上看是利用不完整的并且带有随机干扰的信息 给出总体目标量的估计。在实际问题中,我们在抽样调查之前对总 体及调查单位往往不是一无所知的,而是事先掌握某些可以利用的 总体辅助信息。这些辅助信息对提高估计精度有积极作用,如不充分利用必将造成信息资源的浪费。基于这种考虑利用已知的辅助变量信息构造比率估计量就可使估计精度加以改进。
前两章讨论了只涉及一个调查变量的总体指标(总体目标量)的估计问题,但在许多实际问题中常常会涉及到两个调查变量(指标)Y和X。除了要对
定义:总体比率指两个变量的总体总值或总体均值之比,令R为总体比率,则R
需要应用比率估计的情况
(1) 利用双变量样本对总体比率进行估计需应用比率估计量,此时两个变量均为调查变量。
(2) 一个变量为调查变量,另一个变量表现为与调查变量有密切关系的辅助变量,在对调查变量总体总值、总体均值等目标量进行估计时,利用已知的辅助变量信息构造比率估计量可以改进估计的精度。
一、比率估计量
定义: (总体比率R的比率估计)在简单随机抽样下,若分别以y, x表示样本总值,以
称为R的比率估计。
定义:(总体均值、总体总值的比率估计)在简单随机抽样下,若X是与Y高度相关的辅助变量,且总体均值
分别称为总体均值
复杂估计量与简单估计量的比较
前两章所讨论的估计量都是只使用调查变量样本信息的线性估计量,称为简单估计量。
比率估计量除了使用调查变量样本信息外,还要使用辅助变量总体信息与样本信息,而且是非线性估计量。这类估计量称为复杂估计量。
由于比率估计量使用的信息比简单估计量多,因而有可能比简单估计量有更高的精度。
二、比率估计量的偏差与方差
比率估计量的偏差
比率估计量是有偏估计量,样本量比较大时,
比率估计量的方差
![7301331ed68c3591719f7e08b5ea12f6.png](https://i-blog.csdnimg.cn/blog_migrate/c61b79d0310c838569590ae374733f11.png)
结论
比率估计量的方差主要取决于
三、比率估计量方差的估计与置信区间
比率估计量方差的估计
![30d58b44af67d27a4dd0ed49c8475131.png](https://i-blog.csdnimg.cn/blog_migrate/07fadf4206775fe0187fdd5175159505.jpeg)
比率估计量的置信区间
对于一般的n,比率估计量呈右偏分布。但当n>30,
![729a9883c496f9419064c27a2ffc685e.png](https://i-blog.csdnimg.cn/blog_migrate/817414935aa026e4e8d7684fb6bfde28.jpeg)
其中
![3e972214227b4fb4f09b201a2e276dfe.png](https://i-blog.csdnimg.cn/blog_migrate/a9c3f7ec85566067b7397072a6343329.jpeg)
解:要估计的是总体比率R。
![ec8f1ca5ff9a1982b6c0187b0e705e89.png](https://i-blog.csdnimg.cn/blog_migrate/2cf4f21c76e63b8cd9ada1075cc08793.jpeg)
![b1c97008718352adc18efb483501a3ee.png](https://i-blog.csdnimg.cn/blog_migrate/97a8bc3b8cb12ae6a6aa3daef9ad8f4c.png)
即该地区人均每天食品支出7.33元, 区间估计为[6.28, 8.38]元。
四、比率估计量优于简单估计量的条件
比率估计量
![3f006fba5a6ce6731845696086e63baa.png](https://i-blog.csdnimg.cn/blog_migrate/03f0f2f35854f884fb461ee735d17786.png)
简单估计量
![7b1b468ef17d83f7f7f2c4a79cb6eeaa.png](https://i-blog.csdnimg.cn/blog_migrate/2e7b010cbb44b033b0602c5e4d87a192.png)