《概率论》
条件概率:
P
(
B
∣
A
)
=
P
(
A
B
)
P
(
A
)
P(B|A)=\frac{P(AB)}{P(A)}
P(B∣A)=P(A)P(AB)
乘法公式: P ( A B ) = P ( A ) P ( B ∣ A ) P(AB)=P(A)P(B|A) P(AB)=P(A)P(B∣A)
全概率公式: P ( A ) = ∑ i = 1 n P ( A B i ) = ∑ i = 1 n P ( B i ) P ( A ∣ B i ) P(A)=\sum\limits_{i=1}^nP(AB_i)=\sum\limits_{i=1}^nP(B_i)P(A|B_i) P(A)=i=1∑nP(ABi)=i=1∑nP(Bi)P(A∣Bi)
贝叶斯公式: P ( B i ∣ A ) = P ( A B i ) P ( A ) = P ( B i ) P ( A ∣ B i ) ∑ j = 1 n P ( B j ) P ( A ∣ B j ) P(B_i|A)=\frac{P(AB_i)}{P(A)}=\frac{P(B_i)P(A|B_i)}{\sum\limits_{j=1}^nP(B_j)P(A|B_j)} P(Bi∣A)=P(A)P(ABi)=j=1∑nP(Bj)P(A∣Bj)P(Bi)P(A∣Bi)
基本概率公式
加法规则:
P
(
x
)
=
∑
y
P
(
x
,
y
)
P(x)=\sum \limits_y P(x,y)
P(x)=y∑P(x,y)——对应于《概率论》中的全概率公式
乘法规则:
P
(
x
,
y
)
=
P
(
x
)
P
(
y
∣
x
)
P(x,y)=P(x)P(y|x)
P(x,y)=P(x)P(y∣x)——对应于《概率论》中的乘法公式
其中
x
x
x和
y
y
y是随机变量
贝叶斯定理
假设随机变量
D
D
D表示数据,随机变量
θ
\theta
θ表示模型参数。
P
(
θ
∣
D
)
=
P
(
θ
)
P
(
D
∣
θ
)
P
(
D
)
P(\theta |D)=\frac{P(\theta)P(D|\theta)}{P(D)}
P(θ∣D)=P(D)P(θ)P(D∣θ)
P
(
θ
)
P(\theta)
P(θ)是先验概率,
P
(
θ
∣
D
)
P(\theta|D)
P(θ∣D)是后验概率,
P
(
D
∣
θ
)
P(D|\theta)
P(D∣θ)是似然函数。
统计学两大学派
- 经典统计学派(频率学派)认为模型已定,参数未知,参数是固定的,只是还不知道;
- 贝叶斯统计学派是通过观察到的现象对概率分布中的主观认定不断进行修正。
极大似然估计属于经典统计学派的策略,贝叶斯估计属于贝叶斯统计学派的策略。
假设先验分布是均匀分布,取后验概率最大,就能从贝叶斯估计得到极大似然估计。