【概率论与数理统计(研究生课程)】知识点总结11(多元统计分析基本概念)

小吴不会敲代码吧

已于 2022-12-04 09:58:24 修改

阅读量609

点赞数

分类专栏：计算机基础数学文章标签： 1024程序员节概率论多元统计分析随机向量

于 2022-10-24 10:02:39 首次发布

本文链接：https://blog.csdn.net/weixin_46334596/article/details/127486463

版权

计算机基础同时被 2 个专栏收录

13 篇文章 1 订阅

订阅专栏

数学

12 篇文章 1 订阅

订阅专栏

原文地址：【概率论与数理统计(研究生课程)】知识点总结11(多元统计分析基本概念)

随机向量

设 $X_1,X_2,\cdots,X_p$ 为 $p$ 个随机变量，由它们组成的向量：
$X=X(X_1,X_2,\cdots,X_p)^\top$
称为随机向量。

随机向量的分布函数和密度函数

设 $X=(X_1,X_2,\cdots,X_p)^\top$ 是一随机变量，它的多元分布函数是：
$F(x)=F(x_1,x_2,\cdots,x_p)=P(X_1\le x_1,X_2\le x_2, \cdots, X_p\le x_p)$
式中： $x=(x_1,x_2,\cdots,x_p)\in R^p$ ，并记成 $X\sim F(x)$ 。

设 $X\sim F(x)=F(x_1,x_2,\cdots,x_p)$ ，若存在一个非负函数 $f(\cdot)$ ，使得：
$F(x)=\int\limits_{-\infty}^{x_1}\cdots\int\limits_{-\infty}^{x_p}f(t_1,t_2,\cdots ,t_p)dt_1\cdots dt_p$
对一切 $x\in R^p$ 成立，则称 $X$ 或 $F (x)$ 有分布密度 $f(\cdot)$ ，并称 $X$ 为连续型随机向量。

$f(\cdot)$ 仍然要满足非负归一性。

随机向量的独立性

两个随机向量 $X$ 和 $Y$ 称为相互独立的，若
$P(X\le x,Y\le y)=P(X\le x)P(y\le y)$
对一切 $x, y$ 成立。

若 $F (x, y)$ 为 $(X, Y)$ 的联合分布函数， $G (x)$ 和 $H (y)$ 分别为 $X$ 和 $Y$ 的分布函数，则 $X$ 和 $Y$ 相互独立当且仅当 $F (x, y) = G (x) H (y)$ 。
若 $(X, Y)$ 有分布密度函数 $f (x, y)$ ，用 $g (x)$ 和 $h (y)$ 分别表示 $X$ 和 $Y$ 的密度函数，则 $X$ 和 $Y$ 相互独立当且仅当 $f (x, y) = g (x) h (y)$ 。

在上述定义中， $X$ 和 $Y$ 的维数一般是不同的。
可推广到多元。

随机向量的均值

设 $X=(X_1, X_2,\cdots,X_p)^\top$ 有 $p$ 个分量，若 $E(X_i)=\mu_i(i=1,2,\cdots,p)$ 存在，定义随机向量 $X$ 的均值为：
$\begin{bmatrix} E(X_1) \\ E(X_2) \\ \vdots \\ E(X_p) \end{bmatrix} =\begin{bmatrix} \mu_1 \\ \mu_2 \\ \vdots \\ \mu_p \end{bmatrix} = \boldsymbol{\mu}$
式中， $\boldsymbol{\mu}$ 为一个 $p$ 维向量，称为均值变量。

当 $A$ 、 $B$ 为常数矩阵时，由定义可以立即推出如下性质：

$E (A X) = A E (X)$
$E (A X B) = A E (X) B$

随机向量的协方差矩阵

$\begin{aligned} D(X)&=Cov(X,X)=E\{[X-E(X)][X-E(X)]^\top) \\ &= \begin{bmatrix} Cov(X_1,X_1) & Cov(X_1,X_2) &\cdots & Cov(X_1,X_p) \\ Cov(X_2,X_1) & Cov(X_2,X_2) &\cdots & Cov(X_2,X_p) \\ \vdots & \vdots & \cdots & \vdots \\ Cov(X_p,X_1) & Cov(X_p,X_2) &\cdots & Cov(X_p,X_p) \\ \end{bmatrix} \\ &=(\sigma_{ij})_{p\times p}\xlongequal{def}\Sigma \end{aligned}$

称为 $p$ 维随机向量 $X$ 的协方差矩阵，简称为 $X$ 的协方差矩阵，称 $∣ C o v (X, X) ∣$ 为 $X$ 的广义方差，它是协方差矩阵的行列式之值。
$Cov(X,Y)=\begin{bmatrix} Cov(X_1,Y_1) & Cov(X_1,Y_2) &\cdots & Cov(X_1,Y_p) \\ Cov(X_2,Y_1) & Cov(X_2,Y_2) &\cdots & Cov(X_2,Y_p) \\ \vdots & \vdots & \cdots & \vdots \\ Cov(X_p,Y_1) & Cov(X_p,Y_2) &\cdots & Cov(X_p,Y_p) \\ \end{bmatrix}$
称为随机向量 $X$ 和 $Y$ 的协方差矩阵，若 $Cov(X,Y)=\boldsymbol{0}$ ，则称 $X$ 和 $Y$ 不相关。

当 $A$ 、 $B$ 为常数矩阵时，由定义可以推出协方差矩阵有如下性质：

$D(AX)=AD(X)A^\top=A\Sigma A^\top$
$Cov(AX,BY)=ACov(X,Y)B^\top$
协方差矩阵是一个半正定矩阵

随机向量的相关矩阵

若随机向量 $X=(X_1,X_2,\cdots,X_p)^\top$ 的协方差矩阵存在，且每个分量的方差大于 $0$ ，则 $X$ 的相关矩阵定义为 $R=(r_{ij})_{p\times p}$ 为 $X$ 的相关矩阵，其中：
$r_{ij}=\frac{Cov(X_i,Y_j)}{\sqrt{D(X_i)}\sqrt{D(Y_j)}}=\frac{\sigma_{ij}}{\sqrt{\sigma_{ii}\sigma_{jj}}},\quad i,j=1,2,\cdots,p$
这里 $D(X_i)=Cov(X_i,X_i)=\sigma_{ii}$ 为随机变量 $X_i$ 的方差，而 $\sqrt{\sigma_{ii}}$ 为 $X_i$ 的标准差。

若记 $V^{\frac{1}{2}}=diag(\sqrt{\sigma_{11}}, \sqrt{\sigma_{22}}, \cdots, \sqrt{\sigma_{pp}})$ 为标准差矩阵，则：
$\Sigma=V^{\frac{1}{2}}RV^{\frac{1}{2}}$
或
$R=(V^{\frac{1}{2}})^{-1}\Sigma (V^{\frac{1}{2}})^{-1}$

小吴不会敲代码吧

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
【概率论与数理统计(研究生课程)】知识点总结11(多元统计分析基本概念)

《概率论与数理统计》是高校本科生和研究生必修课程，本文总结了多元统计分析基础中的知识点，包括随机向量、随机向量的分布函数和密度函数、随机向量的独立性、随机向量的数字特征。
复制链接

扫一扫