朴素贝叶斯算法

laufing

已于 2024-06-02 16:12:32 修改

阅读量110

点赞数

分类专栏：机器学习算法学习文章标签：机器学习分类算法 python 朴素贝叶斯算法

于 2021-03-11 21:29:08 首次发布

本文链接：https://blog.csdn.net/weixin_45228198/article/details/114680542

版权

机器学习算法学习专栏收录该内容

29 篇文章 0 订阅

订阅专栏

Naive Bayes

贝叶斯定理
先验概率及估计
后验概率及估计
例子
多项式NB
高斯NB
sklearn中的NB
基于NB 的垃圾邮件分类

朴素贝叶斯：
1、

特征

条件独立假设
2、基于

贝叶斯定理

--条件概率公式

分类算法，广泛应用于NLP --文本分类

贝叶斯定理

条件概率公式：
$\frac {p(x,y)} {p(x)}$

$=\frac {p(y)p(x|y)} {p(x)}$
$=\frac {p(y)*p(x^{(1)},x^{(2)}...x^{(n)}|y)} {p(x)}$

其中 $p (x, y)$ 为随机变量 $x, y$ 的联合概率分布
若 $x, y$ 相互独立，则 $p (x, y) = p (x) * p (y)$

由于朴素贝叶斯是 $特征$ 条件独立假定的，
即 $x^{(1)},x^{(2)}...x^{(n)}$ 之间相互独立

则 $\frac {p(y)*p(x^{(1)}|y)*p(x^{(2)}|y)...p(x^{(n)}|y) } {p(x)}$

先验概率及估计

假如 $y$ 服从多项式分布，取值有 $k$ 类， $y^{(1)},y^{(2)}...y^{(k)}$ ，类别 $y^{(l)}$ 发生的概率记为 $p_l$ ，即为先验概率
进行m次随机实验，假如类别为 $y^{(l)}$ 发生了 $M_l$ 次，则似然函数：
$L(p_l) = p_l^{M_l}*(1-p_l)^{m-M_l}$

采用极大似然法估计 $p_l$ ：

对 $L(p_l)$ 取对数，然后对 $p_l$ 求导，令其= 0
求得 $p_l = \frac {M_l}{m}$

后验概率及估计

朴素贝叶斯分类中，对于一个样本 $x_i$ ，其属于类别 $y^{(l)}$ 的概率为：
$p(y^{(l)}|x_i) = \frac {p(x_i,y^{(l)})}{p(x_i)}$
此条件概率即为后验概率
使用 $l$ 类别的先验概率， $l$ 类别下的条件概率，来估计此后验概率

例子

假如，班级有100个学生，男生60，女生40，男生中近视人数占一半，女生中近视的只有25%，随机选出一个近视的学生，其为女性的概率是？

解：
要求解的概率：
$\frac {p(女性，近视)}{p(近视)}$
$=\frac {p(女性)*p(近视|女性)}{p(近视)}$

$p (女性) = 0.4$
$p (近视 ∣ 女性) = 0.25$
$p (近视) = 0.4$

则所求概率为 $0.25$

多项式NB

先验概率，条件概率，均服从多项式分布，则为多项式朴素贝叶斯

from sklearn.naive_bayes import MultinomialNB
clf = MultinomialNB(alpha=1.0) #拉普拉斯平滑

高斯NB

特征值，为连续值时，采用高斯分布进行估计 $条件概率$ ，则为高斯朴素贝叶斯

from sklearn.naive_bayes import GaussianNB
clf = GaussianNB()

sklearn中的NB

from sklearn.naive_bayes import MultinomialNB
clf = MultinomialNB(alpha=1.0) #alpha 平滑参数

from sklearn.naive_bayes import GaussianNB
clf = GaussianNB()

基于NB 的垃圾邮件分类

垃圾邮件分类

不文明评论的检测

laufing

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
朴素贝叶斯算法

Naive Bayes贝叶斯定理先验概率及估计后验概率及估计多项式NB高斯NBsklearn中的NB基于NB 的垃圾邮件分类朴素贝叶斯：1、特征条件独立假设2、基于贝叶斯定理 --条件概率公式分类算法，广泛应用于NLP贝叶斯定理先验概率及估计后验概率及估计多项式NB高斯NBsklearn中的NBfrom sklearn.naive_bayes import MultinomialNBclf = MultinomialNB(alpha=1.0) #alpha 平滑参数from
复制链接

扫一扫