6 总体与样本

最新推荐文章于 2020-12-09 15:16:26 发布

蟹老板蟹老板

最新推荐文章于 2020-12-09 15:16:26 发布

阅读量889

点赞数 1

分类专栏：概率论与数理统计

本文链接：https://blog.csdn.net/Xiexiexietx/article/details/107819640

版权

概率论与数理统计专栏收录该内容

3 篇文章 0 订阅

订阅专栏

6.1 总体与样本

在数理统计中，我们将所研究的对象的全体称为总体，而将总体中的每个成员称为个体。
总体中所包含的个体的数量称为样本的容量，如果一个总体所包含的个体数量是有限的，则称之为有限总体。如果总体所包含的个体数量是无限的，则称之为无限总体。
样本：被抽取的部分个体
简单随机样本
- 随机样本 $X_1,X_2,…，X_n)$ 中，每个 $X_i$ 与 $X_n$ 是相互独立的随机变量
- 这些样本和总体 $X$ 同分布
获得简单随机样本
- 简单随机抽样
- 对于有限个体采用放回抽样
- 对于无限总体（或很大的总体）采用不放回抽样

6.2 统计量与抽样分布

一、统计量

定义设 $(X_1, X_2, \dots, X_n)$ 为来自总体 $X$ 的一个样本， $g(x_1, x_2, \dots, x_n)$ 是 $X_1, X_2, \dots, X_n$ 的函数，若 $g$ 中不含位置参数，则称 $g(X_1, X_2, \dots, X_n)$ 是一统计量。

常用统计量：

样本平均值：
$\overline X = \dfrac{1}{n} \sum_{i=1}^{n} X_i$
样本方差：
$S^2= \dfrac{1}{n-1} \sum_{i=1}^{n}(X_i - \overline X)$
样本标准差：
$S=\sqrt{\frac{1}{n-1} \sum_{i=1}^{n}(X_i-\overline{X})}$
样本 $k$ 阶原点矩：
$A_k=\frac{1}{n} \sum_{i=1}^{n} X_i^k， \quad k=1,2,3,\dots$
样本 $k$ 阶中心矩：
$B_k=\frac{1}{n}\sum_{i=1}^{n}(X_i-\overline X)^k,\quad k=1,2,3,\dots$

在一次具体的观察中，统计量是具体的数值；但脱离具体的观察或试验，统计量应看作随机变量。

统计量的分布称为抽样分布

二、正态总体的常用统计量的分布

( 一 ) $\chi^2$ 分布

定义设 $X_1, X_2, \dots, X_n$ 为独立同分布的随机变量，均服从 $N (0, 1)$ ，则称随机变量
$\chi^2 = \sum_{i=1}^{n} X_i^2$
为服从自由度为n的 $\chi^2$ 分布，记为 $\chi^2 \sim \chi^2(n)$ .

自由度：独立变量的个数

概率密度（~~不重要~~）
$\begin{cases} \dfrac{1}{2^{\frac n2 \Gamma(\frac n2)}} y^{\frac {n}{2}-1}e^{-{\frac y2}} & \text{y>0}\\ 0& \text{其他} \end{cases}$
其中，
$\Gamma(\alpha)=\int_{0}^{+\infty}x^{\alpha-1}e^{-x}dx \\ \Gamma(n)=(n-1)!$
性质:

$\chi^2$ 分布的可加性 若 $\chi_1^2 \sim \chi^2(n_1)，\chi_2^2 \sim \chi^2(n_2)$ ，并且 $\chi_1^2$ 与 $\chi_2^2$ 相互独立，则有
$\chi_1^2 + \chi_2^2 \sim \chi^2(n_1 + n_2)$
$\chi^2$ 分布的期望和方差 若 $\chi^2 \sim \chi^2(n)$ ，则有
$E(\chi^2)=n,\quad D(\chi^2)=2n$

$\chi^2$ 分布的上分位点 对于给定的正数 $\alpha$ , $0<\alpha<1$ , 满足条件
$P\{ \chi^2>\chi^2_\alpha(n) \}=\int_0^{\infty}f(y)dy=\alpha$
的点 $\chi_\alpha^2(n)$ 就是 $\chi_2(n)$ 分布的上 $\alpha$ 分位点。

（二）t 分布

定义设 $X\sim N(0, 1)，Y \sim \chi^2(n)$ ，且X与Y相互独立，则称随机变量
$\dfrac{X}{\sqrt{Y/n}}$
为服从自由度n的 t 分布，记为 $\sim t(n)$ .

概率密度函数 ：
$h(t)=\dfrac{\Gamma[(n+1)/2]}{\sqrt{\pi n}\Gamma(n/2)}(1+\frac{t^2}{n})^{-(n+1)/2}$
当 $\rightarrow +\infty$ 时,
$\displaystyle \lim_{n \rightarrow +\infty} h(1)=\frac{1}{\sqrt{2\pi}}e^{-t^2/2}$
故当n足够大时，t 分布近似于 $N (0, 1)$ 分布。

t 分布的上分位点 对于给定的 $\alpha$ , $0<\alpha<1$ , 满足条件
$P\{ t>t_\alpha(n)\}=\int_{t_\alpha}^\infty h(t) dt=\alpha$
的点 $t_\alpha(n)$ 就是 $t (n)$ 分布的上 $\alpha$ 分位点。
$t_{1-\alpha}(n)=-t_\alpha(n)$

（三）F 分布

定义设 $\sim \chi^2(n_1)，V \sim \chi^2(n_2)$ ，且U与V相互独立，则称随机变量
$\dfrac{U/n_1}{V/n_2}$
服从自由度为 $n_1, n_2)$ 的F分布，记为 $\sim F(n_1, n_2)$ .

概率密度函数 :
$\psi(y)= \begin{cases} \dfrac{\Gamma[(n_1+n_2)/2](n_1/n_2)^{n_1/2}y^{(n_1/2)-1}}{\Gamma(n_1/2)\Gamma(n_2/2)[1+(n_1y/n_2)]^{(n_1+n_2)/2}} & \text{y>0}\\ 0& \text{其他} \end{cases}$
性质：

若 $\sim F(n_1, n_2)$ ，则 $\dfrac{1}{F} \sim F(n_2, n_1)$ .
若 $\sim t(n)$ ，则 $T^2 \sim F(1, n)$

F 分布的上分位点 对于给定的 $\alpha$ , $0<\alpha<1$ , 满足条件
$P\{ F>F_\alpha(n_1,n_2)\}=\int_{F_\alpha(n_1,n_2)}^\infty \psi(y) dy=\alpha$
的点 $F_\alpha(n_1,n_2)$ 就是 $F(n_1,n_2)$ 分布的上 $\alpha$ 分位点。

三、正态总体的样本均值与样本方差的分布

定理一二三 设 $X_1,X_2,\dots, X_n$ 是来自正态总体 $N(\mu, \sigma^2)$ 的样本，则

$\bar{X} \sim N(\mu, \dfrac{\sigma^2}{n})$ ；
$\dfrac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$ ；
$\bar{X}$ 和 $S^2$ 相互独立；
$\dfrac{\bar{X} - \mu}{S/\sqrt n} \sim t(n-1) $

定理四 设 $X_1,X_2,\dots, X_n$ 与 $Y_1,Y_2,\dots,Y_n$ 分别是来自正态总体 $N(\mu_1,\sigma_1^2)$ 和 $N(\mu_2, \sigma_2^2)$ 的样本，且两样本相互独立。记 $\bar{X}=\dfrac{1}{n_1} \displaystyle\sum_{i=1}^{n_1}$ 和 $\bar{Y}=\dfrac{1}{n_2} \displaystyle\sum_{i=1}^{n_2}$ 分别为它们的样本均值； $S_1^2=\dfrac{1}{n_1-1} \displaystyle\sum_{i=1}^{n_1}({X_i-\bar{X})^2}$ , $S_2^2=\dfrac{1}{n_2-1} \displaystyle\sum_{i=1}^{n_2}({Y_i-\bar{Y})^2}$ 分别为它们的样本方差，则有

$\dfrac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2}=F(n_1-1,n_2-1)$
当 $\sigma_1^2=\sigma_2^2=\sigma_3^2$ 时，
$\dfrac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{S_w \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \sim t(n_1+n_2-2)$
其中，
$S_w^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2},\quad S_w=\sqrt{S_w^2}$

蟹老板蟹老板

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
6 总体与样本

6.1 总体与样本在数理统计中，我们将所研究的对象的全体称为总体，而将总体中的每个成员称为个体。总体中所包含的个体的数量称为样本的容量，如果一个总体所包含的个体数量是有限的，则称之为有限总体。如果总体所包含的个体数量是无限的，则称之为无限总体。样本：被抽取的部分个体简单随机样本随机样本(X1,X2,…，Xn)(X_1,X_2,…，X_n)(X1,X2,…，Xn)中，每个XiX_iXi与XnX_nXn是相互独立的随机变量这些样本和总体XXX同分布获得简单随机样本简单随机抽样
复制链接

扫一扫