实验四:朴素贝叶斯模型应用实践
一、实验目的
1.了解贝叶斯原理;
2.理解朴素贝叶斯算法原理;
3.掌握朴素贝叶斯工作流程
4.初步应用朴素贝叶斯分类器在分类中应用;
二、 实验内容
(以下实验二选一)1
1、文档分类
给定4种中文文档类型:女性、体育、文学、校园,其中训练集放在train文件夹里,测试数据放在test文件夹里,停用词放在stop文件夹里。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pZaF04vS-1632969729073)(E:\机器人学院\大三上\机器学习\实验代码和数据\第四次实验报告-代码-图片\贝叶斯-情感分类图片\1.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-KS1xL3UM-1632969729076)(E:\机器人学院\大三上\机器学习\实验代码和数据\第四次实验报告-代码-图片\贝叶斯-情感分类图片\2.png)]
请使用朴素贝叶斯分类对训练集进行训练,并对测试集进行验证,,并给出测试集的准确率。
2、情感分类
要求建立文本情感分类模型,选手用训练好的模型对测试集中的文本情感进行预测,判断其情感为「Negative」或者「Positive」。所提交的结果按照指定的评价指标使用在线评测数据进行评测。数据格式如下:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qDdhMkfb-1632969729078)(E:\机器人学院\大三上\机器学习\实验代码和数据\第四次实验报告-代码-图片\贝叶斯-情感分类图片\3.png)]
提供样本数据集的规模为6328,其中10%用于测试,90%用于训练。计算预测正确率。