鄙人学习笔记
文章目录
统计量及其抽样分布
统计量是样本的函数.它不依赖于任何未知参数。推断统计学的重要作用就是,通过从总体中抽取样本构造适当的统计量,由样本性质去推断关于总体的性质。
统计量
- 统计量的概念
统计量在统计学中的地位相当于随机变量在概率论中的地位。
常用统计量
- 样本的均值
- 样本方差
- 样本变异系数
- 样本k阶距
- 样本k阶中心距
- 样本偏度
- 样本峰度
次序统计量
极差、中位数、分位数、四分位数等都是次序统计量。
充分统计量
在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。
关于分布的几个概念
- 抽样分布
在总体X的分布类型已知时,若对任一自然数n,都能导出统计量T=T(X1,X2,…,Xn)的分布的数学表达式,这种分布称为精确的抽样分布。它对样本量n较小的统计推断问题非常有用。
精确的抽样分布大多是在正态总体情况下得到的。在正态总体条件下,主要有卡方分布、t分布、F分布,常称为统计三大分布。
抽样分布就是样本统计量的分布。
- 渐近分布
在统计学的抽样分布理沦中。至今已求出的精确抽样分布并不多。通常精确抽样分布是很难求得的,有时尽管求出了精确抽样分布。但也因为过于复杂而难以应用。
所以统计学家借助极限工具,寻求在样本量n无限增大时,统计量T(X1,X2,…,Xn)的极限分布。在实际应用中,当n较大时,就用这种极限分布作为抽样分布的一种近似,这种极限分布常称为渐近分布。现在有不少重要的统计方一法就是基于渐近分布提出的。
由正态分布导出的几个重要分布
卡方分布
- 定义
- 性质
t分布
- 定义
- 性质
F分布
- 定义
- 性质
样本均值的分布与中心极限定理
- 样本均值的分布
- 中心极限定理
样本比例的抽样分布
如果在样本大小为n的样本中具有某一特征的个体数为X,则样本比例为:
以后就用样本比例,来估计总体比例π
两样本平均值之差的分布
两样本比例之差的分布
设分别从具有参数 π 1 \pi_1 π1和参数 π 2 \pi_2 π2的二项总体中抽取包含 n 1 n_1 n1个观测值和 n 2 n_2 n2个观测值的独立样本,则两个样本比例之差的抽样分布为:
p 1 ^ − p 2 ^ = X 1 n 1 − X 2 n 2 \hat{p_1} - \hat{p_2}= \frac{X_1}{n_1}- \frac{X_2}{n_2} p1^−p2^=n1X1−n2X2
具有下列性质:
E
(
p
1
^
−
p
2
^
)
=
π
1
−
π
2
D
(
p
1
^
−
p
2
^
)
=
π
1
(
1
−
π
1
)
n
1
+
π
2
(
1
−
π
2
)
n
2
E(\hat{p_1} - \hat{p_2})=\pi_1 - \pi_2 \\D(\hat{p_1} - \hat{p_2})= \frac{\pi_1(1-\pi_1)}{n_1} + \frac{\pi_2(1-\pi_2)}{n_2}
E(p1^−p2^)=π1−π2D(p1^−p2^)=n1π1(1−π1)+n2π2(1−π2)
当
n
1
n_1
n1和
n
2
n_2
n2很大时,
(
p
1
^
−
p
2
^
)
(\hat{p_1} - \hat{p_2})
(p1^−p2^)的抽样分布近似为正态分布。
关于样本方差的分布
- 样本方差的分布
- 两个样本方差比的分布