机器学习中生成模型与判别模型的概念理解
变量定义
x代表特征向量,y代表标签label。
生成模型的贝叶斯表达
P
(
y
∣
x
)
=
P
(
x
,
y
)
p
(
x
)
=
P
(
x
∣
y
)
P
(
y
)
p
(
x
)
P(y|x) =\frac{P(x,y)}{p(x)} =\frac{P(x|y)P(y)}{p(x)} \quad
P(y∣x)=p(x)P(x,y)=p(x)P(x∣y)P(y)
其中
P
(
x
,
y
)
=
P
(
x
∣
y
)
P
(
y
)
P(x,y)=P(x|y)P(y)
P(x,y)=P(x∣y)P(y)即联合概率密度。
生成模型已知了 P ( x ) P(x) P(x), P ( y ) P(y) P(y)先验概率,通过贝叶斯公式求得最终的 P ( y ∣ x ) P(y|x) P(y∣x)。
未知的概率是 P ( x ∣ y ) P(x|y) P(x∣y),即由标签y来推断属性特征x,所以称为生成
判别模型
判别模型则直接得到后验概率
P
(
y
∣
x
)
P(y|x)
P(y∣x)
不需要使用
P
(
x
∣
y
)
P(x|y)
P(x∣y),由特征直接预测标签叫做判别。
总结
所以,
- 生成是指由标签得到具体的特征向量,即y到x。
- 判别即预测标签,由x到y。