实验6语义计算
一、目的及要求:
- 掌握文本分类、聚类等语义计算的基本原理;
- 掌握常用语义计算NLP工具包的使用;
二、实验准备:
测试语料
三、实验内容及过程:
1)文本分类实验
使用任意方法或NLP工具,编写文本分类程序。
要求:
- 至少包含3个分类。
- 至少给出10个测试用例,用于测试分类算法,并计算分类准确度。
本次三个分类分别为positive,negative和neutral,我们首先预设置了三种情感色彩的句子各30句以txt格式保存作为预训练数据集,其中情感色彩与句子用空格分离,方便提取标签以及内容。
在实验中,我们采用了特征提取和拟合的方式来训练模型,下面是代码展示:
这次实验的分词我们使用jieba分词,之后定义了一个类来实现:
初始化定义特征提取以及模型,首先现训练,run_classify这个方法用于输出标签以及语句,下面是测试main函数
我们定义了每种语句各4句用于输出结果,下是运行结果:
可以看出,当句子含义较为明确时,上述的简单分类器有很好的效果。
> 更多博客内容访问我的博客网站:[回锅炒辣椒的博客](https://www.xsblog.site/)
相关资源: