东北大学应用数理统计第一章知识点总结——抽样分布

最新推荐文章于 2023-02-03 18:14:35 发布

笛语星落——一只在编程路上不断爬起的小白

最新推荐文章于 2023-02-03 18:14:35 发布

阅读量1.5k

点赞数 6

分类专栏：应用数理统计

本文链接：https://blog.csdn.net/qq_36770651/article/details/109828706

版权

应用数理统计专栏收录该内容

10 篇文章 36 订阅

订阅专栏

抽样分布

一、概率论基础

1.1 相关基础

随机事件：可能发生、也可能不发生的事件
事件的关系：包含、不相容、独立
（1）不相容（互斥）：P(AB)=0
（2）独立：P(AB)=P(A)*P(B)
事件的运算：和事件、交事件、差事件、对立事件

1.2 概率及基础运算

概率P(A)：随机事件在一次试验中发生的可能性
条件概率 P(B|A)： $P(B|A)=\frac{P(AB)}{P(A)}$
概率计算中的常用公式：加法公式、减法公式、乘法公式、全概率公式、Bayes公式
（1）全概率公式： $P(A)=\sum\limits_{i = 1}^n {{P(A|B_i)*P(B_i)}}$
（2）Bayes公式： $P(B|A)=\frac{P(B)*P(A|B)}{P(A)}$

1.3 密度函数与分布函数

分类：离散型随机变量、连续性随机变量
（1）离散型随机变量：两点分布、二项分布、泊松分布
（2）连续性随机变量：均匀分布、指数分布、正态分布
密度函数
（1）两点分布：n=1时的二项分布
（2）二项分布：X~B(n,p)
$P(X=k)=C_n^kp^k(1-p)^{n-k}$
（3）泊松分布：P( $\lambda$ )
$\frac{\lambda ^k}{k!}e^{-\lambda}$
（4）均匀分布：X~U( $\alpha$ , $\beta$ )
$\begin{cases} \frac{1}{\beta-\alpha}, & \alpha<x<\beta \\ 0, & 其他 \end{cases}$
（5）指数分布：E( $\lambda$ )
$\begin{cases} \lambda e^{-\lambda x}, & x\ge0 \\ 0, & x<0 \end{cases}$
（6）正态分布：Z~N( $\mu$ , $\sigma^2$ )
$\frac{1}{\sqrt{2\pi} \sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}, -\infty<x<+\infty$
分布函数
$\int_{-\infty}^x f(y)dy$

1.4 Gamma分布 $\Gamma(\alpha,\lambda)$

公式
$p(x)=\frac{\lambda^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\lambda x},x>0,\alpha >0, \lambda >0$
$\Gamma(\alpha)=\int_{0}^{+\infty} x^{\alpha - 1}e^{-x}dx$
特殊情况

参数 $\lambda$ 的指数分布就是 $\Gamma(1,\lambda)$
自由度n的卡方分布 $\chi^2(n)$ 就是 $\Gamma(\frac{n}{2},\frac{1}{2})$
Gamma分布 $\Gamma(\alpha,\lambda)$ 对于 $\alpha$ 具有可加性；而且如果X~ $\Gamma(\alpha,\lambda)$ ,则cX— $\Gamma(\alpha,\lambda/c)$

1.5 随机向量

联合分布函数、联合分布律、联合密度
从联合分布到边缘分布
随机变量的独立性（两个离散随机变量的独立性）
二维正态与多元正态分布
条件分布：条件概率的推广
独立同分布随机变量的和（正态分布的可加性、二项分布的可加性、卡方分布的可加性）

1.6 数字特征

数学期望：随机变量取值的加权平均
$EX=\int_{-\infty}^{+\infty} xf(x)dx$

二项分布： $E X = n p, D X = n p (1 - p)$
泊松分布： $EX=DX=\lambda$
均匀分布： $EX=\frac{\alpha + \beta}{2}, DX=\frac{(\beta-\alpha)^2}{12}$
指数分布： $EX=\frac{1}{\lambda}, DX=\frac{1}{\lambda^2}$
正态分布： $EX=\mu, DX=\sigma^2$

方差：随机变量在期望附近取值的分散程度
$DX=E((X-EX)^2)=E(X^2)-(EX)^2$
切比雪夫不等式
$P(|X-EX|\ge \varepsilon) \leq \frac{DX}{\varepsilon^2}$
$P(|X-EX|\leq \varepsilon) \ge 1 - \frac{DX}{\varepsilon^2}$
协方差：刻化两个随机变量之间的相依关系
$C o v (X, Y) = E [(X - E X) (Y - E Y)] = E (X Y) - E X E Y$
相关系数：刻化两个随机变量之间线性关系的程度
$\rho_{xy}=\frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}}$
随机向量的数字特征（期望向量、协方差矩阵）
条件数学期望
（1）离散随机变量的条件期望
$E(Y|X=x_i)=\sum_{j=1}y_j \times p(Y=y_j|X=x_i)$
（2）连续随机变量的条件期望
$E(Y|X=x)=\int_{-\infty}^{+\infty} y \times p(y|x)dy$
特征函数： $f(t)=Ee^{itX},t\in R^1$
（1）二项分布： $f(t)=(q+pe^{it})^n$
（2）泊松分布： $f(t)=e^{\lambda (e^{it} - 1)}$
（3）均匀分布： $\frac{e^{itb}-e^{ita}}{it(b-a)}$
（4）Gamma分布： $f(t)=(1-\frac{it}{ \lambda })^{-\alpha}$
（5）正态分布： $f(t)=e^{i\mu t - \frac{1}{2} \sigma^2t^2}$

1.7 大数定律与中心极限定理

伯努利大数定律
$\lim_{n \to \infty} P\{ |\frac {n_A}{n} -p| < \varepsilon \} = 1 \Rightarrow \frac{n_A}{n} \to p$
中心极限定理
（1）二项分布
$\lim_{n \to \infty}P{\{\frac{X_n-np}{\sqrt{npq}} \leq x\}} = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{x} e^{- \frac{x^2}{2}}dx$
（2）同分布： $E(X_n) = \mu, D(X_n) = \sigma^2 \ne 0$
$Y_n = \frac{\sum_{i=1}^n X_i-n\mu}{\sqrt{n} \sigma}——N(0,1)$

二、统计量及分布

1.1 定义与种类

定义：自变量为来自总体X的一组样本，的一个完全已知的函数
注意：统计量自身带有总体中未知参数的信息，但统计量的表达式中不能出现任何未知的参数。
种类：充分统计量，完备统计量
（1）充分统计量：没有损失样本所包含的总体未知参数的任何信息
（2）完备统计量：假定T是一个统计量，如果对于任意函数 $\varphi(·)$ ，只要 $E_\theta \{\varphi(T) = 0\}=1$ ，对所有的参数 $\theta$ 都成立，则统计量T就称为是一个完备统计量。

1.2 概率函数

公式
$\theta)=\prod_{k=1}^n p(x_k,\theta)$

离散总体时，样本的联合分布率
连续总体时，样本的联合密度函数

指数型分布族
（1）定义：如果总体X密度（或分布律） $p(x,\theta)$ 可表示成：则称X的分布是一个指数型分布族。
$p(x,\theta)=C(\theta)h(x)exp\{ \sum_{i=1}^k b_i(\theta) T_i(x) \}$
（2）性质

常见的二项分布、泊松分布、指数分布、正态分布等都属于指数型分布族。
如果X的总体是指数型分布族，则 $(\sum T_1(X_i), ... , \sum T_k(X_i))$ 是充分完备统计量。

特殊分布的统计量
（1）总体X~泊松分布 $P(\lambda)$ ，因此参数 $\lambda$ 的完备统计量是 $\sum_{k=1}^n X_k$ 或者 $\overline{X}$
（2）总体X~正态分布 $N(\mu, \sigma^2)$ ，因此参数 $(\mu, \sigma^2)$ 的完备统计量是 $(\overline{X}, \frac {1}{n-1} \sum_{k=1}^{n}(X_k-\overline{X})^2)$
（3）总体X~均匀分布 $U(0,\theta)$ ，它并不是一个指数分布族，但是也可以证明参数 $\theta$ 的完备统计量仍然就是它的充分统计量 $X_{(n)}$

1.3 常用统计量

平均：样本均值、中位数、众数
$\overline{X}=\frac{1}{n} \sum_{k=1}^{n} X_k$
变差：样本方差（或标准差）、极差
$S^2=\frac{1}{n-1} \sum_{k=1}^{n} (X_k- \overline{X})^2$
$Range = X_{(n)} - X_{(1)}$
特殊：顺序统计量（从小到大）

1.4 统计量的三大分布

卡方分布 $\chi^2{(n)}$
（1）构造： $K^2 = X_1^2 + X_2^2 + ... + X_n^2$
（2）注意事项： $X_1, X_2, ... , X_n$ 独立同分布于 $N (0, 1)$
（3）数字特征： $E (X) = n, D (X) = 2 n$
（4）性质：可加性（ $\chi^2{(n_1)} + \chi^2{(n_2)}$ ~ $\chi^2{(n_1+n_2)}$ ）
（5）上侧分位点： $\chi_\alpha^2(n):P\{X>c\}=\alpha$
t 分布 $t (n)$
（1）构造： $X$ ~ $N (0, 1), Y$ ~ $\chi^2(n), T=\frac{X}{\sqrt{Y/n}}$
（2）注意事项： $X 、 Y$ 独立
（3）数字特征： $\ge 2), D(X)=\frac{n}{n-2}(n \ge 3)$
（4）性质： $\to \infty$ 时，t(n)的极限分布是标准正态
（5）双侧分位点： $t_{\alpha/2}(n):P\{|X|>c\}=\alpha$
F分布 $F (m, n)$
（1）构造： $X$ ~ $\chi^2(m), Y$ ~ $\chi^2(n), F=\frac{X/m}{Y/n}$
（2）注意事项： X、Y独立
（3）数字特征： $E(X)=\frac{n}{n-2}$
（4）性质：如果 $T - t (n)$ ，则有 $T^2$ ~ $F (1, n)$
（5）上侧分位点： $F_{\alpha/2}(m, n):P\{X>c\}=\alpha$
$F_{1-\alpha}(m,n)=\frac{1}{F_{(\alpha)}(n,m)}$

1.5 正态总体的抽样分布

基本定理

$\frac{\sqrt{n}(\overline{X}-\mu)}{\sigma}$ ~ $N (0, 1)$
$\frac{(n-1)S^2}{\sigma^2}$ ~ $\chi^2(n-1)$
$\overline{X}$ 与 $S^2$ 独立
$\frac{\sqrt{n}(\overline{X}-\mu)}{S}$ ~ $t (n - 1)$
$\frac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2}$ ~ $F(n_1 - 1, n_2 - 1)$ （X,Y分别来自两个独立的正态总体）
如果假定 $\sigma_1^2=\sigma_2^2$ ，定义：
$S_w^2=\frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2}$
则有
$\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_1)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} - t(n_1 + n_2 - 2)$

多元正态分布的基本性质

$N(\mu,\sum):f(x)=\frac{1}{(2\pi)^{n/2}\sqrt{det \sum }}exp\{-\frac{1}{2}(x-\mu)^T\sum^{-1}(x-\mu)\}$
X服从n维正态的充分必要条件是：对任意n维列向量 $l$ ，有 $l^TX$ ~ $N(l^T\mu, l^T\sum l)$
如果 $X$ ~ $N(\mu, \sum)$ , $A$ 是任意 $\times n$ 矩阵 $\leq n)$ ，则有 $A X$ ~ $N(A\mu, A\sum A^T)$

三、常考题型及解题思路

证明变量独立

$\eta = \binom{\eta_1}{\eta_2} = \binom{\xi_1 + \xi_2}{\xi_1 - \xi_2}=\begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix}\binom{\xi_1}{\xi_2}$ ~ $N(\mu,\sum)$