(纯属为了记录自己学习的点滴过程,引用资料都附在参考列表)
1 基本概念
情感分析
对于情感分析而言,只需要准备标注了正负情感的大量文档,就能将其视作普通的文本分类任务来解决。此外,一些带有评分的电影、商品评论也可以作为“天然”的标注语料库。
2 问题
给出某酒店评论数据,正负评论各2000条组成,训练情感分类模型,并对测试数据预测;
3 解决思路
化归为文本分类问题,使用文本分类的一般步骤,算法使用Naive Bayesian Model;
4 实现
# -*- coding:utf-8 -*-
from pyhanlp import *
from tests.test_utility import ensure_data
IClassifier = JClass(