一种情感判别分析体系在汽车品牌舆情管理中的应用

本文提出了一种新的情感分析系统,通过改进情感词典和运用朴素贝叶斯分类算法,提高了情感分析准确率,尤其适用于汽车品牌的舆情管理。该系统在处理否定句和程度副词时表现出色,情感判别准确率达到86.7%。
摘要由CSDN通过智能技术生成

一种情感判别分析体系在汽车品牌舆情管理中的应用

宋云生

深圳联友科技有限公司,广东 深圳 518031

摘要:品牌舆情管理涉及文本、语音等自然语言产物的处理,如挖掘文本内涵的情感、观点等并对其量化,才能进一步分析品牌所处的舆论环境。对自然语言中情感的量化即情感判别分析,针对传统的基于词典的情感分析和基于监督模型的情感分析存在的不足,提出了一种新的情感分析系统,并结合朴素贝叶斯分类算法,提高了情感分析的准确率,并增强了量化分析情感强度的能力。经测试,提出的文本情感分析引擎的情感判别准确率高于常见的分析方法,且不具有非常明显的行业特异性。

关键词:情感分析;监督模型;朴素贝叶斯;自然语言处理

doi:10.11959/j.issn.2096-0271.2017061

640?wx_fmt=jpeg

论文引用格式:宋云生. 一种情感判别分析体系在汽车品牌舆情管理中的应用[J]. 大数据, 2017, 3(6): 55-64.

SONG Y S. Application of an emotion discriminant analysis system in the management of automobile brand[J]. Big Data Research, 2017, 3(6): 55-64.

640?wx_fmt=jpeg

引言

随着互联网以及各类新兴网络社交媒体的快速发展与普及,由用户发表的文字信息也在暴增,如论坛帖子、微博、博客、产品评论等。如何有效地对这些海量文本信息进行挖掘,识别其中的情感倾向,并加以合理有效地利用,是非常值得探讨的问题。情感分析又称倾向性分析,是人们对事物以及事物的属性持有的意见、情绪和情感的计算研究[1]。事物可以是产品、服务、组织、个人、事件、问题或者话题。情感分析也可以被定义为通过自然语言处理(natural language processing,NLP)技术从文本、演讲、微博等数据源中自动挖掘态度、观点、意见和情绪的过程[2]。文本情感分析就是分析一段文字的情感倾向,作为舆情监控的基础工作,用途广泛。社交网络越来越火,“意见领袖”越来越多,允许用户对商品和服务评价打分的站点更是如雨后春笋,用户的评价和建议可以全网传播。这些文本类型的数据毫无疑问是精准营销的动力来源。企业可以根据情感分析建立自己的数字形象,识别新的市场机会,做好市场细分,进而推动产品成功上市,但抓住这些评论的价值部分也是企业的巨大挑战。政府同企业一样,需要通过情感分析监控、缓解、引领舆情,消弭社会矛盾,上述正是情感分析的应用背景。

但与如此重要的背景背道而驰的是中文情感分析系统的弱势,常见的情感分析分为基于词典的情感分析基于监督模型的情感分析。基于词典的情感分析,顾名思义,非常依赖于情感词典的构建,KuLW等人[3]和KajiN等人[4]对情感词典的构建开展了深入的研究。通常先将情感词分为正向(褒义)和负向(贬义),然后统计一条待分析的中文文本分词的正向词个数和负向词个数,如果正向词个数大于负向词个数,则这条文本属于情感正向,否则属于情感负向。有些研究者对情感词典进行了人工加权,比如“爱”和“喜欢”的权重不一样,人工给予“爱”更高的权重。但是无论怎么改变,这种分析方式都存在以下缺陷:首先,准确率非常低,一般为50%左右,几乎不能支撑舆情监控要求;其次,人工定义情感词的正负倾向或权重,工作量巨大,而且非常武断;最后,这种方式对于否定句和程度副词加强的语句几乎无效,从而丧失了分析情感细腻性(程度)的能力。另一种是基于监督模型的情感分析,即通过人工标注一个训练集(训练集的每一条文本都要人工将其分为情感正向或情感负向),然后使用训练集训练模型,模型训练完成后,预测待分析文本。这种方法虽然基于大量的训练集暂时提高了准确率(一般75%左右),但是标注训练集等如此浩繁的工作让使用者望而却步,另外,人工标注训练集的粒度导致了这种方式同样不具有分析情感细腻性的能力,或者能力较弱。

本文构建了一种新的情感分析系统,解决了这些比较具体的问题,化繁就简,提高了情感分析的准确率,并具有细腻分析情感的能力,为各大行业的舆情分析提供了一种新的实践路径。

2  舆情管理在各个行业的需求

早在互联网普及之前

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值