贝叶斯分类

最新推荐文章于 2024-06-22 23:30:20 发布

JeJe_33

最新推荐文章于 2024-06-22 23:30:20 发布

阅读量194

点赞数 1

分类专栏： ML 文章标签：机器学习 python

本文链接：https://blog.csdn.net/qq_44807945/article/details/113623445

版权

ML 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

1.朴素贝叶斯法

基于贝叶斯定理与特征条件独立假设的分类方法；
1.1步骤：
a.给定训练集，基于特征条件独立假设学习输入输出的联合概率分布；
b.基于模型对给定x利用贝叶斯定理求出后验概率最大的输出y。
1.2 先验概率分布及条件概率分布
先验概率分布
$P (y = c k) k = 1, 2, 3 . . . K$
条件概率分布
$P(X=x|Y=ck)=P(X^1 = x^1...X^n = x^n|Y=ck)$
由条件独立假设（牺牲一定的准确性），上式拆分为
$\prod_{i = 1}^{n}P(X^i=x^i|Y=ck)$
由贝叶斯公式求出后验概率
$P(Y=ck|X=x)=\frac{P(X=x|Y=ck)P(Y=ck)}{\sum_{1}^{n}P((X=x|Y=ck)P(Y=ck)}$
后验概率最大的类即x的类输出
由 $P (X = x ∣ Y = c k)$ 已知，得到朴素贝叶斯分类器为
$max_{ck}P(Y=ck|X=x)=\frac{P(Y=ck)\prod_{i = 1}^{n}P(X^i=x^i|Y=ck)}{\sum_{1}^{n}P(Y=ck)\prod_{i = 1}^{n}P(X^i=x^i|Y=ck)}$
由于分母为常量，因此可以简化为 $max_{ck}P(Y=ck|X=x)=P(Y=ck)\prod_{i = 1}^{n}P(X^i=x^i|Y=ck)$
取后验概率最大化的原因：等价于期望风险最小化

1.3 极大似然估计
使用极大似然估计进行参数估计，即得到该结果最有可能的参数值
1.4 贝叶斯估计
极大似然估计可能会出现0值，将影响后验概率结果（目标函数取的是乘积）
使用贝叶斯估计
$即在分子加\lambda分母加入S_j\lambda$
确保分数大于零且和依旧为1
$P_\lambda(x^i=a_jl|Y=ck)=\frac{P(x^i=a_jl,y=ck)+\lambda}{P(y=ck)+S_j\lambda}$
i为X中第i个变量，l为可能取的值([1,Sj])
$\lambda一般取1，即拉普拉斯平滑$