文章名:《Sentiment Analysis of Chinese Microblog Based on Stacked Bidirectional LSTM》
作者:JUNHAO ZHOU1 , YUE LU1 , HONG-NING DAI 1 , (Senior Member, IEEE), HAO WANG 2 , (Member, IEEE), AND HONG XIAO3
年份 2019
1 Introduction
当前的微博不再只是人们分享日常和趣事的平台,而且也是针对当前热点事件等可以发表个人言论和感受的网络站点。因此如何在微博段评论中提取有效信息成为研究热点。
A.Motivation
当前有很多研究微博短评的技术,基于词典和外部知识库等,目前遇到的挑战主要有以下几点:
(1)同一词在不同文本中表达的含义不一样。
(2)由于微博短评特点,用户表达情感极性词很经常是俚语或者其他非正式中文表达。
(3)微博评论文本长度有限,可以有几个单词或者一个句子组成一条评论。有许多隐含的上下文特征通常很难发现。当前的很多技术也没有关注上下文本特征,没有关注到长距离文本依赖最终判断情感极性造成失误。
B.Contributions
首次提出Continuous Bag-of-Words(CBOW)和Stacked bi-directional Long short-term memory(Stacked Bi-LSTM)两者结合的新模型,优势融合,缺点互补。
主要贡献如下:
a.结合两种模型优点,例如有学习有效丰富的语义信息和上下文信息。
b.通过分析研究从微博上爬取的约3000条评论(已标记情感极性,正负对半)。
c.对模型实验结果进行全面评估,包括训练中调整的参数等等。
2 Related Works
把现有的研究分成两种类型:(1)基于传统机器学