目录
抽样:
总体:研究的所有事件的集合
样本:从总体中选取的相对较小的集合,可用于做出关于总体的结论
抽样:1. 定义目标总体;2. 确定抽样单位,即抽样的对象类型;3. 确定抽样空间,即总体中所有抽样单位的列表
-
有限总体抽样:
抽样总体的数目是有限的。
例:政治团需要估计候选人支持率,选择德州400名登记选民组成样本,德州所有登记选民作为抽样总体。
方法:简单随机抽样
以相同的概率,从容量为N的有限总体中抽取容量为n的样本
-
无限总体抽样:
抽样总体的数目是无限的。
例:轮胎制造厂需要对新型轮胎平均使用寿命进行估计,选择120个新型轮胎组成样本,一个由生产过程某一段特定时间所生产的全部轮胎作为抽样总体
方式:
随机样本:1.抽取的每个个体均来自同一整体;2.每个个体抽取是独立的
-
其他抽样:
1.分层抽样:总体划分几个组,组中单位相似(如年龄、部门等),每组之间尽可能不同,并进行简单抽样;
2.整群抽样:划分几个群,每个群尽量与其他群相似,用简单随机抽样抽取几个群,然后用群中的每一个抽样单位形成样本;
3.系统抽样:选取数字k,每到第k个单位就抽样一次。
点估计量:
由样本数据得出,是对总体参数的估计
样本/总体均值:
样本方差:
总体方差:
样本比率:
P = 目标样本容量/样本容量
抽样分布:
即概率分布
样本均值的抽样分布:
1.样本均值的数学期望:
样本均值等于总体均值
2.样本均值的标准差:
(1)有限总体:
N代表总体容量,n代表样本容量
(2)无限总体:
注:样本容量不大于总体容量的5%,可以使用无限总体公式;
样本均值的标准差为均值的标准误差,有助于确定样本均值与总体均值的偏离程度
3.样本均值抽样分布的形式
(1) 总体服从正态分布,任何样本容量下的样本均值的样本分布均是正态分布
(2) 总体不服从正态分布,中心极限定理可以确定样本均值的抽样分布形状
中心极限定理:
从总体中抽取容量为n的简单随机样本,当样本很大时(n>30),样本均值的抽样分布近似正态分布
注:
1.当总体是严重偏态或出现异常点时,样本容量需要达到50
2.当总体是离散型时,正态近似汇总所需样本容量一般依赖总体比例
实践:
泊松分布:
X~P0(λ), μ=δ^2=λ, 根据中值极限定理,x~N(μ,δ^2/n),代入μ=λ,δ^2 =λ,则x~N(λ,λ/n)
二项分布:
X~B(n,p), μ=np, δ^2=np(1-p), 根据中值极限定理,x~N(μ,δ^2/n),代入μ=np,δ^2 =np(1-p),则x~N(np,p(1-p))
样本比率的抽样分布(二项分布):
当np>=5 and n(1-p)>=5时,二项分布可以用正态分布近似
样本比率的数学期望:
样本比率等于总体比率
样本比率的标准差:
(1)有限总体:
N代表总体容量,n代表样本容量
(2)无限总体:
样本统计量应具备的性质
(1) 无偏性:即样本无偏统计量的所有可能值的数学期望或均值等于被估计的总体参数
(2) 有效性:总体同一参数的两个不同的无偏点估计量,较小标准误差的点估计量比其他点估计量更相对有效
(3) 一致性:如果随着样本容量的增大,点估计量的值与总体参数越来越接近,则该点估计量是一致的