java微博情感倾向性分析_基于中文微博语料的情感倾向性分析

第 49卷 Vo1.49 第 11期 No.11 山 东 大 学 学 报 (理 学 版 ) Journal of Shandong University(Natural Science) 2014年 11月 Nov.2014 文章编号 :1671-9352(2014)114)001-07 DOI:10.6040/j.issn.1671-9352.3.2014.194 基 于 中文微博语料 的情感倾 向性分析 罗毅 ,李利 ,谭松波 ,程学旗 (中国科学院计算技术研究所 ,北 京 100190) 摘要:微博的兴起与传播使得短文本情感分类成为 目前的热门研 究领域。通过对中文微博语料的情感倾向性分 析进行研究 ,提 出了一种新 的情感分类方 法。首先构建 了两级 情感词典 ,并对不 同级别情 感词作 不 同增 强;然后 在情感特征方面使用N—Gram方法,尽量获取有限长度博文中的未登录情感词和情感信息。经实验验证与传统方 式相比较,该方法的准确率和召回率都有所提高,在 COAE2014微博情感倾向性评测任务中也取得了较好的成绩。 关键词:情感分类;倾向性分析;观点挖掘 中图分类号:TP391 文献标志码:A Sentiment analysis on Chinese M icro—blog corpus LUO Yi,LI Li,TAN Song—bo,CHENG Xue—qi (Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100190,China) Abstract:The rise and spread of Micro—blog make sentiment classification on short texts become a hot area. A new method was proposed for Micro—blog sentiment classificaiton.First of all,this method will create an emotional dictiona— ry with two-levels,and the words for different levels will get different enhancement;then in order to get features, N—gram method was used,which found new emotional words and emotional inform ation from a short text.The experi— ment results show this approach has improved precision and recall rate compared to the traditional ways.This algorithm also did a very good job in COAE 2014. Key words:sentiment classification;tendentious analysis;opinion mining 0 引言 微博是一个基于关系的信息制造、交流、传播以及获取的社交媒体 ,网民从原来单纯的信息接收方过渡 到了接收和发布信息的完全参与方 。根据新浪微博发布的最新财报统计数据显示 ,新浪微博的注册用户已 经超过 了 5.36亿 ,用户每 日新增的发博量超过

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值