情感分类是对带有感情色彩的主观性文本进行分析推理的过程,在这个过程中我们需要分析出说话人的态度和观点,即他的态度是正面还是反面。情感分类按照其分析的粒度可以分为篇章级,句子级和短语级。篇章级情感分类是指对篇章级别的句子进行情感分类,分类过程中可能需要涉及到句子之间的起承转合,句子级的情感分类是是对句子进行情感分类,短语级的情感分类是指对短语进行情感分类,例如“相机的画质还不错但是电池的续航能力比较差”中,用户对于画质的评价就比较偏正向,对电池的评价就比较偏负向。
情感分析的一般方法也主要分为三种,一种是基于规则的情感分类,这种分类方法主要是依靠情感词典来对文本进行分析;一种是基于机器学习方法的情感分类,还有一种是基于深度学习的情感分类。
这里我们首先介绍前两种方法:
基于规则的情感分析
基于规则的情感分析主要是依赖情感词典,在实际使用中通常被分为四类词:情感词,程度副词,否定词和领域词。利用情感词典和语法分析文本语句的语句结构和情感倾向词,然后简单的利用统计的方式进行分类。一种常见的基于规则的情感分析方式为:定义情感词典,如情感词,程度副词,否定词和领域词等
统计一句话中正向情感词,负向情感词,程度副词,否定词等出现频率
根据上述各个类型的词计算句子的情感得分,计算方式为: