为什么使用累积分布能够使分布均匀化
考虑连续值的情况:
假设已经随机变量X,以及其概率密度P(X)。
已经转化函数
Y
=
F
(
x
)
=
∫
−
∞
x
P
(
r
)
d
r
Y=F(x)=\intop_{-\infty}^{x}P(r)dr
Y=F(x)=∫−∞xP(r)dr
现在需要求Y的分布函数
即
P
(
Y
<
S
)
=
P
(
F
(
x
)
<
S
)
P(Y<S)=P(F(x)<S)
P(Y<S)=P(F(x)<S)
因为F(x)是单调递增的,假设
F
(
x
0
)
=
∫
−
∞
x
0
P
(
r
)
d
r
=
S
F(x_0)=\intop_{-\infty}^{x_0}P(r)dr=S
F(x0)=∫−∞x0P(r)dr=S,则
x
∈
{
−
∞
,
x
0
}
x\in \{-\infty,x_0\}
x∈{−∞,x0},而概率
P
(
F
(
x
)
<
S
)
=
P
(
x
∈
{
−
∞
,
x
0
}
)
=
∫
−
∞
x
0
P
(
r
)
d
r
=
S
P(F(x)<S)=P(x\in\{-\infty,x_0\})=\intop_{-\infty}^{x_0}P(r)dr=S
P(F(x)<S)=P(x∈{−∞,x0})=∫−∞x0P(r)dr=S
所以有
P
(
Y
<
S
)
=
P
(
F
(
x
)
<
S
)
=
S
P(Y<S)=P(F(x)<S)=S
P(Y<S)=P(F(x)<S)=S
概率密度则为上式求导
P
(
Y
)
=
1
P(Y)=1
P(Y)=1,所以变成了均匀分布。
去github