算法的优缺点_朴素贝叶斯算法的优缺点

623d5921156f505922bc35acf061d01e.png


  机器学习算法与自然语言处理推荐 

来源:http://www.cnblogs.com/pinard/p/6069267.html

作者:刘建平Pinard

【机器学习算法与自然语言处理导读】朴素贝叶斯算法是最经典的几个机器学习算法之一,本文对它的优点,缺点进行总结。

1.  朴素贝叶斯算法

朴素贝叶斯属于生成式模型(关于生成模型和判别式模型,主要还是在于是否需要求联合分布),比较简单,你只需做一堆计数即可。如果注有条件独立性假设(一个比较严格的条件),朴素贝叶斯分类器的收敛速度将快于判别模型,比如逻辑回归,所以你只需要较少的训练数据即可。即使NB条件独立假设不成立,NB分类器在实践中仍然表现的很出色。它的主要缺点是它不能学习特征间的相互作用,用mRMR中R来讲,就是特征冗余。引用一个比较经典的例子,比如,虽然你喜欢Brad Pitt和Tom Cruise的电影,但是它不能学习出你不喜欢他们在一起演的电影。

2.  优点

1. 朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率;

2. 对大数量训练和查询时具有较高的速度。即使使用超大规模的训练集,针对每个项目通常也只会有相对较少的特征数,并且对项目的训练和分类也仅仅是特征概率的数学运算而已;

3. 对小规模的数据表现很好,能个处理多分类任务,适合增量式训练(即可以实时的对新增的样本进行训练);

4. 对缺失数据不太敏感,算法也比较简单,常用于文本分类;

5. 朴素贝叶斯对结果解释容易理解。

3.  缺点

1. 需要计算先验概率;

2. 分类决策存在错误率;

3. 对输入数据的表达形式很敏感;

4. 由于使用了样本属性独立性的假设,所以如果样本属性有关联时其效果不好。

4.  应用领域

1. 欺诈检测中使用较多;

2. 一封电子邮件是否是垃圾邮件;

3. 一篇文章应该分到科技、政治,还是体育类;

4. 一段文字表达的是积极的情绪还是消极的情绪;

5. 人脸识别。

6183cce1aa8c2381daabd7b2eb3cb896.png

推荐阅读:

华为调研82位离职博士!任正非发电邮:反思人才流失根源

漫话:如何给女朋友解释为什么双11无法修改收货地址

2019 AI 国际顶级学术会议全在这里,请查收!

968b30721ab3b8707e6523646de7e32e.png

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值