朴素贝叶斯分类【垃圾邮件检测】

最新推荐文章于 2022-11-28 11:36:42 发布

liovo先生

最新推荐文章于 2022-11-28 11:36:42 发布

阅读量2.4k

点赞数 5

分类专栏：机器学习文章标签： python

本文链接：https://blog.csdn.net/weixin_46066900/article/details/106725916

版权

**训练模型基本流程：

获取数据：pandas读取数据；
数据分析：；
数据处理：数据预处理，划分得到训练集测试集；
模型训练与测试：调用sklearn.naive_bayes；
模型评估：使用【f1】评估模型**

问题描述：
根据邮件文本数据预测该邮件是否为垃圾邮件。使用朴素贝叶斯分类器。
数据集：“spam_data.txt”（7148条数据）
其中垃圾邮件：960条，非垃圾邮件：6188条。
数据描述：一共7148条样本，分类标签为{0， 1}分别表示，否和是。基于文本数据，判定邮件是否为垃圾邮件。部分数据如下：

在这里插入图片描述

获取数据：pandas读取数据；

def get_Data(filename):
    data = pd.read_csv(filename, sep=',', engine='python')
    print(data.head())
    return data

数据分析：；

def del_data(data):
    # 分割数据
    X_train, X_test, y_train, y_test = train_test_split(
        data["mail"], data["label"], test_size=0.2, random_state=15)
    # 清洗数据
    train_data = []
    test_data = [

最低0.47元/天解锁文章

liovo先生

关注

5
点赞
踩
17

收藏

觉得还不错? 一键收藏
3
评论
朴素贝叶斯分类【垃圾邮件检测】

**训练模型基本流程：获取数据：pandas读取数据；数据分析：；数据处理：数据预处理，划分得到训练集测试集；模型训练与测试：调用sklearn.naive_bayes；模型评估：使用【f1】评估模型**问题描述：根据邮件文本数据预测该邮件是否为垃圾邮件。使用朴素贝叶斯分类器。数据集：“spam_data.txt”（7148条数据）其中垃圾邮件：960条，非垃圾邮件：6188条。数据描述：一共7148条样本，分类标签为{0， 1}分别表示，否和是。基于文本数据，判定邮件是否为垃圾邮件
复制链接

扫一扫