随机变量的数字特征——《概率论及其数理统计》第四章学习笔记

本文链接：https://blog.csdn.net/weixin_54891898/article/details/124885547

本文概述了《概率论及其数理统计》第四章的主要内容，包括数学期望的离散与连续定义、函数期望定理、方差的计算与性质、协方差与相关系数的定义及应用，以及协方差矩阵的概念和特性。特别强调了变量标准化和切比雪夫不等式在实际问题中的运用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

随机变量的数字特征——《概率论及其数理统计》第四章学习笔记

前言

本来这章应该早点弄出来的，但是奈何我太太太能摆了，所以一直没弄。这次快点弄出来吧。

参考教材不变，依旧是盛骤浙大第四版的《概率论与数理统计》。

这次的内容其实就是四个知识点，数学期望、方差、协方差、协方差矩阵。其中后两个知识点我尽力写好。

MindMap

在这里插入图片描述

先来看期望吧。

数学期望

定义

数学期望其实很好理解，就是均值，当然这里并不是直接计算样本的均值，而是要考虑到样本对应的概率。我们分离散和连续两类来讨论数学期望。

离散型

对随机变量X的分布律为
$P\{X=x_k\} = p_k, \quad k = 1, 2...$
若级数
$\sum_{k=1}^\infty x_k p_k$
绝对收敛，则称改级数为X的 数学期望 ，记为E(X)。即
$\sum_{k=1}^\infty x_kp_k$

连续型

当我们把上面的求和换成积分就得到了连续型的数学期望
$\int_{-\infty}^{\infty}{xf(x)}dx$

函数期望的两个定理

设Y 是随机变量 X 的函数，Y=g(X) (g 是 连续 函数)

如果X 是离散型，其分布律为 P{X =xk} = pk，k=1，2，…，若对应的无穷级数 绝对收敛 则有
$\sum_{k=1}^\infty {g(x_k)p_k}$
如果X是 连续型，其概率密度为 f(x)，若对应积分绝对收敛，则
$\int_{-\infty}^{\infty}{g(x)f(x)dx}$

根据上面两个定理我们可以轻松地解决函数类型的数学期望问题。

性质

关于数学期望有以下4个非常重要的性质：

C 是 常数， E© = C.
X 是一个随机变量，C是常数，则
$E (C X) = C E (X)$
X，Y是两个随机变量，则
$E (X + Y) = E (X) + E (Y)$
该性质可以推广到多个随机变量加和的情况。
X，Y 互相独立，则
$E (X Y) = E (X) E (Y) .$
和3类似，也可以推广到多个随机变量乘积的情况。

方差

方差 我们可以直观地理解为表示数据的 偏离程度，或者说数据的 集中程度。

定义

设X是一个随机变量，若 E{ [X - E(X)] ^ 2} 存在，则称该式为 X 的方差，记为 D(X) 或 Var(X)，即
$D(X) = Var(X) = E\{[X - E(X)]^2\}$
它的开平方，我们记为
$\sigma(X)$
称为 均方差 或 标准差。

离散型

$\sum _{k=1}^\infty {[x_k - E(X)]^2p_k}$

连续型

$\int _{-\infty}^{\infty} {[x-E(X)]^2f(x)dx}$

除了用定义，我们还可以使用下列式子来计算方差：
$D(X) = E(X^2) - [E(X)]^2$

tips：变量标准化

其实这个技巧在第二章的正态分布的例题中，其实我们也有接触过，具体如下
$E(X)=\mu, \quad D(X)= \sigma \\ 取 X* = \frac{X-\mu}{\sigma} \\ E(X^*) = 0, \quad D(X^*) = 1$
X* 就是 X 的 标准化变量。

四个重要性质

在随机变量的 方差存在 的情况下，有如下性质：

C是常数， D© = 0.
X 是随机变量，C 是常数，有
$C^2D(X), \quad D(X + C) = D(X).$
$D(X + Y) = D(X) + D(Y) + 2E \{(X-E(X)(Y-E(Y))) \}$

若 X，Y 互相独立，则有
$D (X + Y) = D (X) + D (Y) .$
一样，也是可以推广多个变量。
D(X) = 0 的 充要条件 是 X 以概率 1 取常数 E(X), 即
$P \{X=E(X) \} = 1$

切比雪夫不等式

设 X 的 E(X) = μ， D(X) = σ^2
$\forall \epsilon > 0 \\ P\{|X - \mu | \geq \epsilon \}\leq \frac{\sigma^2}{\epsilon^2}$

协方差及相关系数

对于二维随机变量，我们除了可以讨论它的期望和方差，我们还可以讨论这两个随机变量间的关系。

协方差和相关系数其实我们在 数据分析 的时候，其实是经常使用的两个数据性质。我们先看课本上对于这两个量的定义。

定义

协方差

记为 Cov(X, Y),
$Cov(X, Y) = E \{[E-E(X)][Y-E(Y)] \}.$

协方差性质

数乘性质
$\quad a,b 是常数$
分配
$Cov(X_1 + X_2, Y) = Cov(X_1, Y) + Cov(X_2, Y)$

不相关与独立

这两个是一个集合的包含问题，或者说是不相关是独立的 必要条件，而独立则是不相关的 充分条件。

对于不相关，我们可以用相关系数 = 0，或者协方差为0 来证明。

而对于变量独立，我们则需要按照定义来证明。

矩、协方差矩阵

只能说我线性代数没学好，现在看这一节有点小懵逼。

设(X, Y) 是二维随机变量，有如下定义

定义

矩

若
$E(X^k), \quad k = 1, 2,...$
存在，则称其为 X 的 k阶原点矩，简称k阶矩。
若
$E\{[X-E(X)]^k \}, \quad k = 2, 3,...$
存在，称其为 X 的k阶中心矩。
若
$E(X^kY^l), \quad k,l = 1, 2,...$
存在，称其为 X 和 Y 的 k+l 阶混合矩
若
$E\{[X-E(X)]^k[Y-E(Y)]^l \}, \quad k,l = 1,2,...$
存在，称它为 X 和 Y 的 k+l 阶混和中心矩。

显然原点矩其实就是 期望，中心矩其实就是 方差， 协方差 就是混合中心距。

协方差矩阵

我们对二维随机变量(X1, X2) 有四个二阶中心矩（假设都存在），记为下式
$c_{11} = E\{[X_1 - E(X_1)]^2 \}, \\ C_{12} = E\{[X_1 - E(X_1)][X_2-E(X_2)] \} = c_{21} \\ C_{22} = E\{[X_2 - E(X_2)]^2 \}$
排成矩阵就是