《Sentiment Analysis of Chinese Microblog Based on Stacked Bidirectional LSTM》论文阅读笔记

本文介绍了结合连续词袋模型(CBOW)和堆叠双向长短期记忆(Stacked Bi-LSTM)的新方法,用于中文微博情感分析。作者针对微博文本的特性,如非正式表达和有限上下文,提出了一个能够捕捉丰富语义和上下文信息的模型,并通过实验展示了其在情感分析任务上的优越性。
摘要由CSDN通过智能技术生成

文章名:《Sentiment Analysis of Chinese Microblog Based on Stacked Bidirectional LSTM》

作者:JUNHAO ZHOU1 , YUE LU1 , HONG-NING DAI 1 , (Senior Member, IEEE), HAO WANG 2 , (Member, IEEE), AND HONG XIAO3

年份 2019

1 Introduction

当前的微博不再只是人们分享日常和趣事的平台,而且也是针对当前热点事件等可以发表个人言论和感受的网络站点。因此如何在微博段评论中提取有效信息成为研究热点。

A.Motivation

当前有很多研究微博短评的技术,基于词典和外部知识库等,目前遇到的挑战主要有以下几点:

(1)同一词在不同文本中表达的含义不一样。

(2)由于微博短评特点,用户表达情感极性词很经常是俚语或者其他非正式中文表达。

(3)微博评论文本长度有限,可以有几个单词或者一个句子组成一条评论。有许多隐含的上下文特征通常很难发现。当前的很多技术也没有关注上下文本特征,没有关注到长距离文本依赖最终判断情感极性造成失误。

‘‘Why are they so mean? This 8-minute show exhibited so many Chinese elements, Chinese technologies as well as our people’s enthusiasm and confifidence. The director Yimou Zhang has already tried his best. I really can’t understand
these people!’’ 举例,本条评论关注长距离文本依赖后,可以判断最终极性是负面的。
 

B.Contributions

首次提出Continuous Bag-of-Words(CBOW)和Stacked bi-directional Long short-term memory(Stacked Bi-LSTM)两者结合的新模型,优势融合,缺点互补。

主要贡献如下:

a.结合两种模型优点,例如有学习有效丰富的语义信息和上下文信息。

b.通过分析研究从微博上爬取的约3000条评论(已标记情感极性,正负对半)。

c.对模型实验结果进行全面评估,包括训练中调整的参数等等。

2 Related Works

把现有的研究分成两种类型:(1)基于传统机器学

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值