05概率论与数理统计笔记——数理统计基础——基于《概率论与数理统计》许忠好

最新推荐文章于 2022-09-17 21:31:15 发布

JamSlade

最新推荐文章于 2022-09-17 21:31:15 发布

阅读量503

点赞数

分类专栏：概率论与数理统计文章标签：概率论机器学习人工智能

本文链接：https://blog.csdn.net/JamSlade/article/details/122512892

版权

概率论与数理统计专栏收录该内容

7 篇文章 2 订阅

订阅专栏

总体与样本

研究对象的全体称为总体，把组成总体的每个成员称为个体

从总体中抽出的部分个体为样本，样本所含的个体称为样品，样本中样品个数称为样本容量

设X是分布函数F(x)的随机变量，若 $X_1,X_2,...,X_n$ 是具有同一分布函数 $F (x)$ 的相互独立随机变量，称 $X_1,X_2,...,X_n$ 是来自总体X（或分布函数 $F (x)$ 中容量为n的简单随机样本，简称为样本

经验分布函数

$x_1,...,x_n$ 是来自总体分布函数F(x)的样本，记 $I_i(x) = \left\{ \begin{aligned} 1& &x_i\le x \\ 0 & & x_i > x\\ \end{aligned} \right.$
则函数 $F_n(x)=\frac{1}{n}\sum^n_{i=1}I_i(x)$ 为经验分布函数

统计量

$X_1,X_2,...,X_n$ 是某总体样本，若样本函数 $T = T(X_1,X_2,...,X_n)$ 不含任何未知参数，称T为统计量

常用统计量
样本均值
$\overline{X} = \frac{1}{n}\sum^n_{i=1}X_i$
样本方差
$S^2=\frac{1}{n-1}\sum^n_{i=1}(X_i-\overline{X})^2=\frac{1}{n-1}(\sum^n_{i=1}X_i^2-n\overline{X}^2)$
样本标准差
$\sqrt{S^2}$
样本k阶原点矩
$A_k=\frac{1}{n}\sum^n_{i=1}X^k_i$
样本k阶中心距
$B_k=\frac{1}{n}\sum^n_{i=1}(X_i-\overline{X})^2$

不难发现 $A_1=\overline{X},B_1=0$

抽样分布

卡方分布

$X_1,X_2,...,X_n$ 独立分布且服从标准正态分布 $N (0, 1)$ ,则称随机变量 $\chi^2=\sum^n_{i=1}X_i^2$ 服从自由度为n的卡方分布
记为 $\chi^2\sim\chi^2(n)\sim Ga(\frac{n}{2},\frac{1}{2})$

不难发现数学期望为n，方差为2n
且卡方分布具有可加性

定理
$X_1,X_2,...,X_n$ 独立分布且服从标准正态分布 $N(\mu,\sigma^2)$
于是有
$\chi^2=\sum^n_{i=1}(\frac{X_i^2-\mu}{\sigma})^2$

t分布

$X\sim N(0,1)~~Y\sim\chi^2(n)$ X和Y相互独立
随机变量 $\frac{X}{\sqrt{Y/n}}$ 满足自由度为n的t分布，记为 $T\sim t(n)$

性质
1） $T\sim t(n)$ ， $n\le1$ 则ET不存在，n >1则ET=0
2） $T\sim t(n)$ ，n >1
$E|T|^k= \left\{ \begin{aligned} <\infty& & k<n \\ =\infty & & k\ge n\\ \end{aligned} \right.$
3) $T\sim t(n)$ ,n>2 $VarT=\frac{n}{n-2}$
4)t(1)是柯西分布
5）n充分大可以用标准正态分布来近似

F分布

$X\sim\chi^2(n)~~Y\sim\chi^2(m)$
$F=\frac{X/N}{Y/M}$ 为自由度为(n,m)的F分布

性质
1） $X\sim t(n)$ ,则 $X^2\sim F(1,n)$
2) $F\sim F(n,m), 1/F\sim F(m,n)$
3) $F_\alpha(n,m) F_{1-a}(m,n)=1$

正态总体下抽样分布

Fisher定理
$X_1,X_2,...,X_n$ 独立分布且服从标准正态分布 $N(\mu,\sigma^2)$ , $\overline{X}和S^2$ 是样本均值和样本方差，则他们独立且
1）
$\overline{X}\sim N(\mu,\frac{\sigma^2}{n})$
2)
$\frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1)$
3)
$\frac{\overline{X}-\mu}{S}\sqrt{n}\sim t(n-1)$

定理
$X_1,X_2,...,X_m$ 独立分布且服从标准正态分布 $N(\mu_1,\sigma_1^2)$
$Y_1,Y_2,...,Y_n$ 独立分布且服从标准正态分布 $N(\mu_2,\sigma_2^2)$
$\overline{X}=\frac{1}{m}\sum^m_{i=1}X_i~~~ \overline{Y}=\frac{1}{n}\sum^n_{i=1}Y_i$

$S^2_X=\frac{1}{m-1}\sum^m_{i=1}(X_i-\overline{X})^2~~~S^2_Y=\frac{1}{n-1}\sum^n_{i=1}(Y_i-\overline{Y})^2$

1）
$\overline{X}-\overline{Y}\sim N(\mu_1-\mu_2~,~\frac{\sigma_1^2}{m}+\frac{\sigma^2_2}{n})$

2）若 $\sigma_1=\sigma_2=\sigma$
$\frac{\overline{X}-\overline{Y}-(\mu_1-\mu_2)}{S_W\sqrt{\frac{1}{m}+\frac{1}{n}}}$
其中
$S^2_W=\frac{(m-1)S^2_X+(N-1)S^2_Y}{m+n-2}$

$\frac{S^2_X/\sigma_1^2}{S^2_Y/\sigma_2^2}\sim F(m-1,n-1)$

JamSlade

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
05概率论与数理统计笔记——数理统计基础——基于《概率论与数理统计》许忠好

总体与样本研究对象的全体称为总体，把组成总体的每个成员称为个体从总体中抽出的部分个体为样本，样本所含的个体称为样品，样本中样品个数称为样本容量设X是分布函数F(x)的随机变量，若X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn是具有同一分布函数F(x)F(x)F(x)的相互独立随机变量，称X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn是来自总体X（或分布函数F(x)F(x)F(x)中容量为n的简单随机样本，简称为样本经验分布函
复制链接

扫一扫