基于Word2Vec的情感词典自动构建与优化-计算机科学.PDF
第 44 卷第1 期 Vo l. 44 No. 1
计算机科学
2017 年 1 月 COMPUTER SCIENCE
Ja口.2017
基于 Word2Vec 的情感词典自动构建与优化
杨小平张中夏王良张永俊马奇凤吴佳楠张悦
(中国人民大学信息学院 北京 100872)
摘 要 情感词典的构建是文本挖掘领域中重要的基础性工作。近几年,情感词典的极性标注从二元褒贬标注向多
元情绪标注发展,词典的领域特性也日趋明显。但是情感类别的手工标注不但费时费力,而且情感强度难以得到准确
量化,同时对领域性的过分关注也大大限制了情感词典的适用性[IJ 。通过神经网络语言模型对大规模中文语料进行
统计训练,并在此基础上提出了基于转换约束集的多维情感词典自动构建方法p 然后研究了基于词分布密度的感情色
彩消歧方法,对兼具褒贬意味词语的感情极性进行区分和识别,并分别计算两种感情色彩下的情感类别与强度;最后
实验证实该词典
提出基于多个语义资源的全局优化方案,得到包含 10 种情绪标注的多维汉语情感词典 SentiRuc 1)
o
在类别标注检验、强度标:主检验、情感消歧效采及情感分类任务中均具有良好的效果,其中的情感强度检验证实该词
典具有极强的情感语义描述力。
关键词 情感分析,多元情感分类,神经网络语言模型,情感消歧,情感强度优化框架
中图法分类号 TP39 1. 1 文献标识码 A 001 10. 11896/j. issn. 1002-137χ2017.01. 008
Automatic Construction and Optimization of Sentiment Lexicon ßased on Wo时2Vec
YANG Xiao-ping ZHANG Zhong-xia WANG Liang ZHANG Yong-jun MA Qi-feng "而 Jia-nan ZHANG Yue
(School of Infom咀tion. Renmin University of China. Beijing 100872 ,China)
Abstract The construction of sentiment lexicon plays an important role in text mining. In recent years ,the lexicon an
notating format gradually evolves from binary annotation to multiple annotation ,and sentiment lexicons of a single spe
cific domain have caught more and more attentions of res回rchers. However ,manual annotation costs too much labor
work and time ,and it is als