朴素贝叶斯
Telescope@moon
这个作者很懒,什么都没留下…
展开
-
使用Python进行文本分类(二)测试算法:根据实际情况修改分类器、准备数据:文档词袋模型
测试算法:根据实际情况修改分类器TabError: Inconsistent use of tabs and spaces in indentation解决方法: 这个错误是说你用了tab键作缩进了, 因为在python不像C/C++里用大括号来区分程序块,而是用缩进 所以缩进很重要你把Tab都换成空格就好了 def classifyNB(vec2Classify, p0Vec,...原创 2018-07-31 21:43:24 · 963 阅读 · 0 评论 -
使用Python进行文本分类(一)准备数据:从文本中构建词向量、训练算法:从词向量计算概率
准备数据:从文本中构建词向量def loadDataSet():#创建实验样本 postingList=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'], ['maybe', 'not', 'take', 'him', 'to', 'dog', 'park', 'stupid']...原创 2018-07-31 19:53:07 · 3106 阅读 · 0 评论 -
示例:使用朴素贝叶斯过滤垃圾邮件
准备数据:切分文本>>> mySent='This book is best book on Python or M.L. I have ever laid eyes upon.'>>> mySent.split()['This', 'book', 'is', 'best', 'book', 'on', 'Python', 'or', 'M.L.',...原创 2018-08-01 15:48:14 · 1059 阅读 · 0 评论 -
示例:使用朴素贝叶斯分类从个人广告中获取区域倾向
下面将使用来自不同城市的广告训练一个分类器,然后观察分类器的效果。我们的目的并不是使用该分类器进行分类,而是通过观察单词和条件概率值来发现与特定城市相关的内容。 收集数据:导入RSS源Python count() 方法用于统计字符串里某个字符出现的次数。可选参数为在字符串搜索的开始与结束位置。 使用iteritems()这个函数得到我们字典中的所有元素,就是键-值对{‘yes’:2,’ma...原创 2018-08-01 21:01:21 · 1379 阅读 · 0 评论