机器学习实战笔记(3.3)-朴素贝叶斯算法(多项式模型的朴素贝叶斯实现)

最新推荐文章于 2024-05-23 15:43:21 发布

洛克的爸爸

最新推荐文章于 2024-05-23 15:43:21 发布

阅读量1.2k

点赞数

分类专栏：学习笔记文章标签：贝叶斯分类朴素贝叶斯机器学习机器学习实战 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/rockla/article/details/78346604

版权

多项式模型的朴素贝叶斯：

实际看，每个词的权重是完全不同的，仅仅看是否出现，其实是无法最大限度的逼近真实。仅仅需要把统计单词的函数做一点点增强，就可以实现统计词频了。

defbagOfWords2VecMN(vocabList, inputSet):

returnVec = [0]*len(vocabList)

for word in inputSet:

if word in vocabList:

returnVec[vocabList.index(word)] +=1

return returnVec

>>> bayes.setOfWords2Vec(myVocabList,['I','him','stupid','not','not','stupid'])

[0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0,0, 0,1, 0, 0, 0, 0, 0]

看，stupid not not都被两次统计了！

>>> bayes.bagOfWords2VecMN(myVocabList,['I','him','stupid','not','not','stupid'])

[0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 2, 1, 0, 0, 0, 0, 0, 0, 0, 0,0, 0,2, 0, 0, 0, 0, 0]

基本都的问题都解决了，下面就是实际应用讲解了。

实际实现就简单了，前面的函数都可以使用。唯一添加的就是要对待分析文本做点数据清洗工作。除去标点符号，然后什么 a 空格等短词汇，整个词汇列表如下：

'roofer', 'create', 'computing', 'been','strategy', 'attaching', 'much', 'treat', 'borders', 'prototyp

最低0.47元/天解锁文章

洛克的爸爸

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习实战笔记(3.3)-朴素贝叶斯算法(多项式模型的朴素贝叶斯实现)

多项式模型的朴素贝叶斯：实际看，每个词的权重是完全不同的，仅仅看是否出现，其实是无法最大限度的逼近真实。仅仅需要把统计单词的函数做一点点增强，就可以实现统计词频了。 defbagOfWords2VecMN(vocabList, inputSet): returnVec = [0]*len(vocabList) for word in inputS
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。