摘要: 反讽是采用内隐的形式来表达情感的一种方法,反讽语句在文字和所想表达的情感上存在着不同,这使得对反讽语句进行情感分类变得更加困难。针对这一现象,提出一种融合反讽语言特征的反讽语句识别模型,通过加入反讽语言特征来提高反讽语句的识别准确率。首先,采用卡方检验算法对反讽语言进行分析并获取语言特征;然后,利用Word2Vec对语言特征进行训练获取语言特征的特征表示,同时使用注意力机制与Bi-GRU(双向门控循环神经单元)模型获取句子的特征表示;最后,将语言特征的特征表示与句子的特征表示进行融合并作为情感分类层的输入,对反讽语句进行识别。与CNN-AT、CNN-Adv、EPSN等3种模型进行对比,实验结果表明,该模型可以有效提高对于反讽语句的识别准确率。
- 关键词:
- 反讽语句识别 /
- 语言特征 /
- 卡方检验算法 /
- Word2Vec /
- 双向门控循环神经单元 /
- 注意力机制 /
- 深度学习 /
- 智能信息处理
反讽是一种特殊的修辞表达方式,其所要表达的真实意图和字面含义完全相反。随着社交网络的兴起以及人们表达情感的方式含蓄而内隐,反讽语句在中文文本中愈发普遍。例如:“节假日还要去加班,真是太充实了!”该语句通过一种反讽的方式来表达自己对于节假日加班的不满。
目前针对反讽识别的研究,主要面向英文文本,缺乏中文语料库。然而基于中文特有的语言现象,对于中文反讽语句的识别研究完全不同于英文文本,这使得对于中文反讽语句深层语义的挖掘成为了文本