机器学习-朴素贝叶斯（侮辱类词汇检测）

最新推荐文章于 2023-12-05 19:10:24 发布

Vivinia_Vivinia

最新推荐文章于 2023-12-05 19:10:24 发布

阅读量1.1k

点赞数

分类专栏：机器学习文章标签： python 机器学习贝叶斯词汇检测

本文链接：https://blog.csdn.net/hester_hester/article/details/96309296

版权

本文探讨了如何使用朴素贝叶斯算法进行侮辱类词汇检测。通过计算特定词汇出现的概率，以此来识别文本是否包含侮辱性内容。尽管在计算中忽略了分母的影响，但这种方法对于判断概率的相对大小仍然有效。

摘要由CSDN通过智能技术生成

根据公式：

可以得出：

这里进行计算时，只需要计算分子，比较大小，因为分母只是对数值有影响，对两个数的比较不会产生影响

import numpy as np

"""创建数据集"""
def loadDataSet():
    postingList = [['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'],
                   ['maybe', 'not', 'take', 'him', 'to', 'dog', 'park', 'stupid'],  # stupid侮辱类
                   ['my', 'dalmation', 'is', 'so', 'cute', 'I', 'love', 'him'],
                   ['