人工智能算法—朴素贝叶斯分类

最新推荐文章于 2022-10-03 11:00:00 发布

soso_blog

最新推荐文章于 2022-10-03 11:00:00 发布

阅读量8.8k

点赞数

分类专栏： soso技术/产品专家介绍文章标签：算法文档网络 python methods 工作

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/soso_blog/article/details/5836953

版权

本文介绍了朴素贝叶斯分类器的工作原理和在文本分类中的应用，探讨了条件概率、贝叶斯公式及其在文档分类中的转换。文章强调了贝叶斯分类器假设特征概率独立，虽然这一假设在实际中并不总是成立，但在某些场景下仍能实现高效分类。此外，文章还讨论了特征提取、训练过程、分类阈值设置以及与其他分类方法的比较。

摘要由CSDN通过智能技术生成

文/腾讯soso 林世飞

以下是个人学习贝叶斯分类器—文本分类的学习笔记，和大家一起学习交流。

准备工作

监督学习型分类器特点，能够从一个不确定度状态开始，通过提供正确和错误的样本，不断来确定哪些特征（特征由特征提取函数，从样本中提取）对于分类更重要，可以有很多个分类器，来应对不同的分类或者过滤需求。所以训练本身非常重要。

先来复习下一个数学符号，条件概率：pr(A|B) 给定B条件下（也就是B发生情况下），A出现的概率。

Bayes公式和文本分类的基本原理

Pr(A | B) = Pr(B | A) x Pr(A)/Pr(B)

其实是由下面这个式子移项得到的

Pr(A | B)×Pr(B) = Pr(B | A) × Pr(A) –个人了解含义是 A 和B同时出现的交集是一样的

在文本分类中变成：

Pr(Category | Document) = Pr(Document | Category) x Pr(Category) /Pr(Document)

我们需要计算当某个Document（这个往往使用特征来表示）出现时候，他可能的分类的概率，取概率最大的一个。

贝叶斯假设每项的各个概率是彼此独立的。即，一个单词在属于某个指定分类的文档中出现的概率，与其他单词出现于该分类的概率是不相关的。

事实上这个假设是不成立的，因为你也许会发现，与有关Python编程的文档相比，包含单词“casino”的文档更有可能包含单词“money”。这意味着，我们无法将采用朴素贝叶斯分类器所求得的结果实际用作一篇文档属于某个分类的概率，因为这种独立性的假设会使其得到错误的结果。不过，我们还是可以对各个分类的计算结果进行比较，然后再看哪个分类的概率最大。在现实中，若不考虑假设的潜在缺陷，朴素贝叶斯分类器将被证明是一种非常有效的文

最低0.47元/天解锁文章

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
5
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

soso_blog CSDN认证博客专家 CSDN认证企业博客

码龄14年

29: 原创

104万+: 周排名

207万+: 总排名

41万+: 访问

: 等级

4237: 积分

399: 粉丝

6: 获赞

693: 评论

30: 收藏

私信

关注

热门文章

分类专栏

最新评论

腾讯soso技术专家系列之总经理孙良
一座青山: 为啥后续不更新文章了呢？
关于go语言
飞飞好奇: 文章不错
关于go语言
wenjin_gu: 请教一下：cgo是否支持回调？如果不支持的话，该如何实现回调功能呢？
腾讯搜搜孙良：“情境搜索”更懂你
xuanxuan134: 顶楼上！
关于go语言
xuanxuan134: equipment, metallurgical, building materials and other industries. Far do not say, take the city development now, the subway, the viaduct, and public buildings, in this new city, all the construction without the support of the crusher. And this year to deeply launch the construction of urbanization and the development of China's west, mining development in the western area of our country and also quickly, there are a lot of large mining of mineral resources and has not yet, will provide a larger market for machinery industry, at the same time increase the crusher the demand of the market. <a href="http://www.crusherproduct.net/grinding.html">grinding mill</a>

大家在看

最新文章

目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。