机器学习-朴素贝叶斯（邮件分类）

最新推荐文章于 2022-11-28 10:40:16 发布

VIP文章 Vivinia_Vivinia

最新推荐文章于 2022-11-28 10:40:16 发布

阅读量679

点赞数 2

分类专栏：机器学习文章标签： python 机器学习朴素贝叶斯邮件分类

本文链接：https://blog.csdn.net/hester_hester/article/details/96331804

版权

原理和前一个的侮辱词汇分类差不多，都是通过测试求出概率，概率大的为分类。（我概率论真的不好，好难理解。。。）

数据包

import numpy as np
import random
import re

"""创建词汇表"""
def createVocabList(dataSet):
    vocabSet = set([])
    for document in dataSet:  # 取出每一行文档（每行七个单词）
        vocabSet = vocabSet | set(document)  # 先将文档转换为set集合，无需不重复，再取并集
    return list(vocabSet)

"""判断输入集中单词是否在词汇表中"""
def setOfWordsVec(vocabList, inputSet):
    returnVec = [0] * len(vocabList)  # 创建一个元素都为0的向量
    for word in inputSet:  # 取输入集的每一个单词
        if word in vocabList:  # 如果单词在词汇表中
            returnVec[vocabList.index(word)] = 1  # 标志位置为一，表示所检测单词在词汇表中
        else:
            print("the word:$s is not in my Vocabulary!" % word)
    return returnVec

"""计算概率"""
def

最低0.47元/天解锁文章

Vivinia_Vivinia

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
机器学习-朴素贝叶斯（邮件分类）

原理和前一个的侮辱词汇分类差不多，都是通过测试求出概率，概率大的为分类。（我概率论真的不好，好难理解。。。）数据包import numpy as npimport randomimport re"""创建词汇表"""def createVocabList(dataSet): vocabSet = set([]) for document in dataSet: ...
复制链接

扫一扫