视频来自b站:StatQuest-Probility vs Likelihood
以小白鼠体重曲线分布图来解释probality 和 likelihood的区别
一、小白鼠体重曲线分布图
小白鼠体重曲线分布是以均值为32,偏差为2.5,最小体重为24,最大体重为40的高斯分布曲线图:
二、probality概率是什么?
假设我们已经有了上面的小白鼠体重曲线分布图!
那么,我们随机选择一只小白鼠,体重是在32 和34 克之间的概率多少呢,在上面的高斯分布曲线图中,我们发现32 < x < 34曲线面积是0.29,即有29%的概率,我们选择的小白鼠的体重是32和34之间。
即
p
r
(
32
<
x
<
34
∣
m
e
a
n
=
32
,
d
e
v
i
a
t
i
o
n
=
2.5
)
=
0.29
pr(32 < x < 34 | mean = 32,deviation = 2.5) = 0.29
pr(32<x<34∣mean=32,deviation=2.5)=0.29
我们得到的probality随着体重范围的不同而不同,但是条件高斯分布图是不变的
例如
p
r
(
x
>
34
∣
m
e
a
n
=
32
,
d
e
v
i
a
t
i
o
n
=
2.5
)
=
?
?
pr(x > 34 | mean = 32,deviation = 2.5) = ??
pr(x>34∣mean=32,deviation=2.5)=??
三、likelihood似然是什么?
假设我们只有一个小白鼠的体重
假设我们不知道小白鼠体重曲线图,但是我们有一个小白鼠,体重是34克,那么该体重在均值为32,方差为2.5的高斯分布曲线上的似然值是多少呢,即
L
(
m
e
a
n
=
32
,
d
e
v
i
a
t
i
o
n
=
2.5
∣
x
=
34
)
=
0.12
L(mean =32, deviation=2.5|x=34)=0.12
L(mean=32,deviation=2.5∣x=34)=0.12
我们得到的likelihood值随着曲线图的改变而不同,但是条件体重34是不变的,例如:
L
(
m
e
a
n
=
34
,
d
e
v
i
a
t
i
o
n
=
2.5
∣
x
=
34
)
=
0.21
L(mean =34, deviation=2.5|x=34)=0.21
L(mean=34,deviation=2.5∣x=34)=0.21
四、总结
1、Probailtiy是固定曲线下的面积
p
r
(
d
a
t
a
∣
d
i
s
t
r
i
b
u
t
i
o
n
)
pr(data|distribution)
pr(data∣distribution)
2、likelihoods 是不同分布曲线下,固定点对应的y值
L
(
d
i
s
t
r
i
b
u
t
i
o
n
∣
d
a
t
a
)
L(distribution|data)
L(distribution∣data)