以下是个人理解,仅供参考。
似然函数是什么
“似然”这两个字从中文看起来很难有个直观的理解。那么,在许多英文文章中被称作“likelihood”,这个单词直观的翻译过来是“(看起来)好像是”,这么一说可能就清楚一些,我们可以把似然这个词理解成好像是,可能是,那么我们就能够模糊的知道,似然函数是一种通过可能性最大化的思想来反推一些参数的函数。本质上它其实是一种概率函数,并且是在我们已经知道结果的前提(条件)下,对某种参数进行反推的思想前置步骤。
一般来说写作:
L
(
参
数
∣
事
件
)
L(参数|事件)
L(参数∣事件)
似然函数能干什么
举个简单的小例子。
假设现在有一个人:他到某镇呆了N天,然后实施了n起抢劫犯罪,并且每次是否进行犯罪的概率P(A)(事件A表示此人在该镇犯罪了)相同,且事件独立。那么我们需要通过这N次事件来推断出这个人下次犯罪的概率,以评估对他的惩罚力度。
那么这个如果随便问一个人,大家都会说“这个人极有可能再次进行作案”,为什么我们会觉得极有可能呢?因为此时我们脑中进行了一个简单的逻辑反推,我们认为这个人一定会偏向于犯罪,所以才会这么猖狂,那么“偏向,喜欢”在这里,其实就是概率的大小,所以,虽然很多人无法得到确切的P(A)概率,但是隐隐约约的会感觉到这个概率不会低。
现在,为了大家的安全,我们就对极有可能的这个词的程度进行一个量化评估,以便做出最合理的处罚,那么,这个时候就需要用到我们的似然函数了。
首先,假设
P
(
A
∣
θ
)
=
θ
P(A|\theta )=\theta
P(A∣θ)=θ
该式表达的是在参数为θ的条件下,A事件发生的概率是多大。
假设了一次的概率后,N天内发生n(N≥n)起抢劫犯罪的概率就是(这里用事件B表示发生n起犯罪):
P
(
B
∣
θ
)
=
C
N
n
θ
n
(
1
−
θ
)
N
−
n
P(B|\theta )=C_{N}^{n}\theta ^{n}(1-\theta )^{N-n}
P(B∣θ)=CNnθn(1−θ)N−n
此时,我们需要默认,已经发生的事,在概率上也是最容易发生的,也就是说此时P(B)的概率需要达到一个极值。因为此时我们需要求得的参数是θ,所以我们的关注点并不在概率P(B|θ)上,因而我们直接写出一个似然函数的形式:
L
(
θ
∣
B
)
=
P
(
B
∣
θ
)
=
C
N
n
θ
n
(
1
−
θ
)
N
−
n
L(\theta |B)=P(B|\theta )=C_{N}^{n}\theta ^{n}(1-\theta )^{N-n}
L(θ∣B)=P(B∣θ)=CNnθn(1−θ)N−n所以可以看到,其实似然函数
L
(
θ
∣
B
)
L(\theta |B)
L(θ∣B)就是一种条件概率的表达方式,大致可以理解为:在事件B发生的情况下,θ应该取什么样的值,才能让L(θ|B)最大,即,才能让B这件事发生的概率最大。
之后的最大似然估计,大致思想也就是这样,最大似然估计的相关应用以及思想在后续学习中也会慢慢添上。