1 平均数(均值)
平均数(均值),其实是针对实验观察到的特征样本而言的。比如我们实验结果得出了 x 1 , x 2 , x 3 , . . . , x n x_1,x_2,x_3,...,x_n x1,x2,x3,...,xn,这 N N N个值,那么我们的均值计算是:
x 1 + x 2 + x 3 + . . . + x n N . \begin{equation} \color{blue} \frac{x_1 + x_2+ x_3 + ...+x_n}{N} . \end{equation} Nx1+x2+x3+...+xn.
比如我们进行掷骰子,掷了六次,点数出现的分别为2,2,2,4,4,4,这六次的观察就是我们的样本,于是我们可以说这次实验的均值为 ( 2 + 2 + 2 + 4 + 4 + 4 ) 6 = 3 \frac{(2+2+2+4+4+4)}{6}=3 6(2+2+2+4+4+4)=3。但是千万不能说成期望是3。
2 期望
期望是针对于随机变量而言的一个量,可以理解是一种站在“上帝视角”的值。针对于它的样本空间而言的。均值是一个统计量(对观察样本的统计),期望是一种概率论概念,是一个数学特征。
首先给出期望定义公式:
离散型随机变量
X
X
X的取值为
X
1
,
X
2
,
.
.
.
,
X
n
X_1,X_2,...,X_n
X1,X2,...,Xn,
X
X
X对应的概率取值为
p
(
X
1
)
,
p
(
X
2
)
,
.
.
,
p
(
X
n
)
p(X_1),p(X_2),..,p(X_n)
p(X1),p(X2),..,p(Xn),可以理解为数据
X
1
,
X
2
,
.
.
.
,
X
n
X_1,X_2,...,X_n
X1,X2,...,Xn出现的频率为
f
(
X
i
)
f(X_i)
f(Xi).则:
E
(
X
)
=
X
1
∗
p
(
X
1
)
+
X
2
∗
p
(
X
2
)
+
.
.
.
+
X
n
∗
p
(
X
n
)
=
X
1
∗
f
(
X
1
)
+
X
2
∗
f
(
X
2
)
+
.
.
.
+
X
n
∗
f
(
X
n
)
,
E
(
X
)
=
∑
k
=
1
∞
X
k
∗
P
k
.
\begin{equation} \color{blue} \begin{aligned} E(X) &= X_1*p(X_1) + X_2*p(X_2) + ...+X_n*p(X_n) \\ &= X_1*f(X_1) + X_2*f(X_2) + ...+X_n*f(X_n) ,\\ &E(X) = \sum_{k=1}^{\infty } X_k* P_k . \end{aligned} \end{equation}
E(X)=X1∗p(X1)+X2∗p(X2)+...+Xn∗p(Xn)=X1∗f(X1)+X2∗f(X2)+...+Xn∗f(Xn),E(X)=k=1∑∞Xk∗Pk.
那么上面那个掷骰子例子对应的期望求法如下:
E
(
X
)
=
1
∗
1
6
+
2
∗
1
6
+
3
∗
1
6
+
4
∗
1
6
+
5
∗
1
6
+
6
∗
1
6
=
1
+
2
+
3
+
4
+
5
+
6
6
=
3.5.
\begin{equation} \color{blue} \begin{aligned} E(X) &= 1* \frac{1}{6} + 2* \frac{1}{6} +3* \frac{1}{6} + 4* \frac{1}{6} +5* \frac{1}{6} +6* \frac{1}{6} \\ &=\frac{1+2+3+4+5+6}{6} = 3.5 . \end{aligned} \end{equation}
E(X)=1∗61+2∗61+3∗61+4∗61+5∗61+6∗61=61+2+3+4+5+6=3.5.
可以看出期望是与概率值联系在一起的。
3 差异
如果说概率是频率随样本趋于无穷的极限 ,期望就是平均数(均值)随样本趋于无穷的极限。可以看出均值和期望的联系也是大数定理联系起来的。
因此,平均数 是一个统计学的概念;期望是一个概率论的概念。
平均数是 实验后 根据实际结果统计得到的样本的平均值 (后验概率);
期望是 实验前 根据概率分布“预测”的样本平均值(先验概率)。
之所以说是预测是因为 在实验前能得到的期望与实际实验得到的样本的平均数总会不可避免的存在偏差,毕竟随机实验的结果永远充满着不确定性。
如果我们能进行无穷次随机实验并计算出其样本的平均数的话,那么这个平均数其实就是期望。 实验样本的平均数会随着实验样本的增多越来越接近期望,就像频率随着实验样本的增多会越来越接近概率一样。