【读书笔记-＞统计学】05-02 “概率”的整体影响-随机变量的线性变换、独立观测值概念简介

本文链接：https://blog.csdn.net/bill2766/article/details/123933216

线性变换

书中给了一个新的情境：在原来的基础上，老虎机的奖励翻5倍，但是拉一次杆的赌本从1美元变成了2美元。

下面是新的概率分布：

y	-2	23	48	73	98
P(Y=y)	0.977	0.008	0.008	0.006	0.001

之前的收益分布的期望和方差分别是“-0.77”和“2.6971”，那么现在呢？
$\\ =-0.85 \\ Var(Y)= \sum(Y-\mu)^2 \\ =(-2+0.85)^2*0.977 + ... + (98+0.850)^2*0.001 \\ =67.4275$
期望稍微下降了一点，因此从长期来看，我们每届可望赔0.85美元；方差增大，这表示从长期看来，我们有可能在这台老虎机上赔更多的钱，但确定性更小。

E(X)与E(Y)之间存在线性关系

新旧收益其实相互关联，每一局的赌本上涨到2美元，赢金则是原来的5倍，它们的期望和方差也存在关系。我们可以看下面：

在这里插入图片描述

我们可以将以上公式推广至任意随机变量，若随机变量为X：
$E(aX+b) = aE(x)+b \\ Var(aX+b) = a^2 Var(X)$
这就是所谓的线性变换，因为X发生的是线性变化—即基础概率保持不变，当数值变为新值，其形式为：aX+b。

其实也很好理解，假设X， $Y = a X + b$ ，a和b是常量。每个 $x_1,x_2,...,x_n$ 为X具体的取值，自然地，对于每个 $y_1,y_2,...,y_n$ ， $y_i=ax_i+b$ 。

概率分布如下图所示：

x	$x_1$	$x_2$	…	$x_n$
y	$y_1$	$y_2$	…	$y_n$
P(X=x)	$P(x_1)$	$P(x_2)$	…	$P(x_n)$
P(Y=y)	$P(x_1)$	$P(x_1)$	…	$P(x_1)$

X的期望为 $E(X)=\sum xP(X=x)$ 。则，
$\\ =\sum (ax+b)*P(x) \\ =\sum ax*P(x) + \sum bP(x) \\ =a[x_1P(x_1)+...x_nP(x_n)] + b(P(x_1)+...+P(x_n)) \\ =a\sum xP(x) + b \\ =aE(x)+b$
X的方差为 $E(X-E(x))^2= \sum(x-E(x))^2P(X=x)$ 。则，
$E(Y-E(Y))^2 \\ = \sum(y-E(Y))^2P(Y=y) \\ = \sum[ax+b-(aE(x)+b)]^2P(X=x) \\ = \sum[a(x-E(x))]^2P(X=x) \\ = \sum a^2*(x-E(x))^2 P(X=x) \\ = a^2 \sum (x-E(x))^2P(X=x) \\ = a^2 Var(x)$

问：方差中的b哪里去了？

答：在概率分布中增加了一个常数仅对期望有影响，对整个方差没有影响。在变量中增加一个常数不过是将概率分布移动一下，分布的形状依然不变。（也可以从上面的推导看出来，b被减掉了）也就是说，期望以b为幅度进行偏移，但由于形状保持不变，所以方差也保持不变。

问：我很惊奇，方差会乘以一个 $a^2$ ，这是为什么？

答：变量乘以一个常数意味着所有基础数据都乘以该常数。在计算方差的过程中要计算各基础数据的平方。由于基础数据都乘以a，因此最终结果是方差乘以 $a^2$ 。（很好理解啦， $E(X-E(x))^2= \sum(x-E(x))^2P(X=x)$ ，每个x乘以a，期望E(X)也乘以a，再相减后平方，直觉地肯定方差会是平方倍）