基于机器学习的邮件分类算法

AI炮灰

已于 2022-04-13 13:55:15 修改

阅读量528

点赞数

分类专栏：深度学习实战代码40例文章标签：深度学习神经网络自然语言处理 tensorflow 深度学习

于 2022-04-02 17:12:54 首次发布

本文链接：https://blog.csdn.net/bigData1994pb/article/details/123921358

版权

深度学习实战代码40例专栏收录该内容

26 篇文章 40 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

今天接了一个单子，主要是做基于机器学习的邮件分类算法的研究：比较简单代码如下所示：

源码如下所示：

#!/usr/bin/python
# -*- coding utf-8 -*-

import numpy as np

def loadFile(filename):
    """
    函数说明：
        加载数据文件
    :param filename:
        文件名
    :return:
        contentList - 切分邮件内容得到的词条
        classVec - 类别标签向量
    """
    file = open(filename)

    contentList = []
    classVec = []

    contents = file.readlines()
    for line in contents:
        content = line.strip('\n').split(' ')   #以空格为分割符，切分邮件的内容，得到该邮件对应的词条
        classVec.append(int(content[0]))    #取出邮件的类别标签
        del(content[0])     #删掉词条中的类别标签
        contentList.append(content)

    return contentList, classVec


def createVocabList(dataSet):
    """
    函数说明：
        根据训练数据，生成一个词汇表
    :param dataSet:
        切分所有邮件得到的词条
    :return:
        list(vocabSet) - 使用训练数据生成的不重复的词汇表
    """

了解本专栏

超级会员免费看

AI炮灰

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
基于机器学习的邮件分类算法

今天接了一个单子，主要是做基于机器学习的邮件分类算法的研究：比较简单代码如下所示：源码如下所示：#!/usr/bin/python# -*- coding utf-8 -*-import numpy as npdef loadFile(filename): """ 函数说明：加载数据文件 :param filename: 文件名 :return: contentList - 切分邮件内容得到的词条
复制链接

扫一扫