前情回顾:之前通过学习不同随机变量的各种概率密度函数,通过已知总体的分布,来推算样本的概率分布。
又由中心极限定理可知,大样本量下,样本服从正态分布。
所以,下面我们开始讨论,如何通过样本估计总体。
一、参数(样本)估计
(一)点估计和区间估计
- 估计前提:知道总体服从什么样的分布。
- 点估计:总体中μ和σ^2未知,用抽取样本计算样本μ和σ ^2 的估计值 代替 总体真值。
但 由于点估计无法确定可靠度量性,因此不能依赖点估计,而是围绕点估计构造总体参数的区间。
- 区间估计:由点估计统计量加减估计误差,得到的。进而构造出总体参数的置信区间。
- 置信水平:置信区间中包含总体参数真值的次数所占的比例(1-α)% (α表示总体参数未在区间内的比例)
- 置信区间:多次的抽样的样本统计量,构成的总体参数估计区间(注:抽样本时,应是:同一个整体,不同的样本。不能是同一批,也不能是完全两个不同的总体抽样)。
- Z代表正态分布统计量
- α代表显著性水平,由于区间是双尾,所以除以2
- σx拔:样本的标准差
2、评价估计量的标准
(1)无偏性(看均值):估计量抽样分布的E(X)=被估计的总体参数
(2)有效性(看方差):更小的标准差更有效。
(3)一致性(看样本量):n越大,估计样本与总体分布是否一致。
sita是待估计的参数,未知。
用样本均值来当作总体的估计值,前提是知道样本的分布类型。
由于估计量是样本的函数,是随机变量,故对不同的样本值,得到的参数值往往不同,如何求估计量是关键问题。
常用构造估计量的方法(两种):矩估计法(连续型:均匀分布)和最大似然估计法(离散型:连续相乘,取对数)。
(二)一个总体参数的区间估计
1.总体均值的区间估计
1.1大样本估计前提:正态总体、σ^2已知,或非正态总体、大样本。
-
使用正态分布统计量
至于为什么分子为σ/根号n,根据下方推导: