前言:本节课讲了条件期望以及他的应用, 任意数量的独立随机变量的加和以及它的期望和方差。
E
[
X
∣
Y
=
y
]
=
∑
x
x
p
X
∣
Y
(
x
∣
y
)
E[X|Y = y] = \sum_x xp_{X|Y}(x|y)
E[X∣Y=y]=x∑xpX∣Y(x∣y)
这个式子是学期望那节课中,给定一个条件Y = y时,x的分布和x的值构成的期望。在这里y 是一个固定的值,就是说已经知道第一节长度是y。在上面那个截断棍子的例子中,有
E
[
X
∣
Y
=
y
]
=
y
2
E[X|Y = y] = \frac{y}{2}
E[X∣Y=y]=2y
如果事先不知道第一节的长度,取消固定Y= y,X|Y可以理解成一个新的随机变量,这个随机变量是关于充当条件的随机变量的函数。
E
[
X
∣
Y
]
=
g
(
Y
)
E[X|Y] = g(Y)
E[X∣Y]=g(Y)这个条件期望是关于Y的一个函数,那么就也是一个随机变量。
Law of iterated expectations:
E
[
X
∣
Y
]
=
g
(
Y
)
E
[
X
∣
Y
=
y
]
=
g
(
y
)
E
[
E
[
X
∣
Y
]
]
=
E
[
g
(
Y
)
]
=
∑
y
g
(
y
)
P
Y
(
y
)
=
∑
y
E
[
X
∣
Y
=
y
]
P
Y
(
y
)
=
E
[
X
]
E[X|Y] = g(Y)\\ E[X|Y = y] = g(y)\\ E[E[X|Y]] = E[g(Y)]\\ = \sum_y g(y)P_Y(y)\\ = \sum_y E[X|Y = y]P_Y(y) = E[X]
E[X∣Y]=g(Y)E[X∣Y=y]=g(y)E[E[X∣Y]]=E[g(Y)]=y∑g(y)PY(y)=y∑E[X∣Y=y]PY(y)=E[X]
The expected value of conditional expectation is the expectation itself.
因为
v
a
r
(
X
∣
Y
=
y
)
var(X|Y = y)
var(X∣Y=y) 是与 y 相关的一个值
同理
v
a
r
(
X
∣
Y
)
var(X|Y)
var(X∣Y)也是一个关于Y的一个函数,因此是一个random variable。
(b)到 (c)用了上一篇的
E
[
E
[
X
∣
Y
]
]
=
E
[
X
]
E[E[X|Y]] = E[X]
E[E[X∣Y]]=E[X]
intuition 留到讲inference的时候
就这个例子可以看出,成绩分布的分散程度可以由两部分组成:
1, 每个班级自己的分散程度
2, 班级与班级之间的分散程度