【情感分析:挖掘观点、情感和情绪】读书笔记-01

《情感分析:挖掘观点、情感和情绪》(美)刘兵,2017年

情感分析,也称观点挖掘。
相关术语最早出现:

  • “情感分析” - 2003年,Nasukawa和Yi;
  • “观点挖掘” - 2003年,Dave。

2000年以前,由于很难获取文本语料库,相关研究工作很少,近十几年,随着互联网及社会媒体的迅猛发展,情感分析的研究随之飞速进步。

随着网络及交互方式的改变,产生了两个研究领域:社交网络分析和情感分析。
情感分析是从社会媒体中挖掘、分析信息的必备技术之一,社会媒体分析就是以情感分析为中心的数据分析。

一、情感分析应用

几乎所有领域都出现了有关情感分析的应用与产品。

例如:预测电影票房,预测政治选举结果,股票市场预测。

二、情感分析研究

从2000年开始,情感分析相关领域快速成长,已经成为自然语言处理、数据挖掘和网络挖掘等领域内最活跃的研究问题,同时在管理学领域内也被广泛研究。

1. 根据所处理文本颗粒度,情感分析研究分为三个级别

1.1 篇章级
假设一篇文档只对一个实体进行了评价(但现实中往往不是这样)。
1.2 句子级
句子级情感分析常与主客观分类任务十分相关(即判别一句话是客观句还是主观句);
但,主观句≠情感句/观点句,客观句≠没有观点信息。
1.3 属性级
直接关注评价对象。

2. 根据观点类型的不同,观点分为两类

2.1 常规型观点
只针对一个目标实体

Coke tastes very good.

2.2 比较型观点
比较多个实体的共同属性

Coke tastes better than Pepsi. //仅代表作者意见(狗头保命)

3. 情感词典及其问题

  • 相同情感词,应用领域及上下文不同,其倾向性可能不同;
  • 一个句子中出现情感词,句子不一定表达情感;

疑问句:Can you tell me which Sony camera is good?
条件句:If I can find a good camera in the shop,I will buy it.

但疑问句和条件句也可能表达情感,例如:
Does anyone know how to repair this terrible printer?
If you are looking for a good car,get a Ford Focus.

  • 讽刺句难以处理,无论其中是否出现情感词;
  • 不含情感词的句子,也可能隐含观点,容易被误判为陈述句。

4. 在社会媒体中,两种类型的文本

  • 单一型帖子,如评论、博客;
  • 对话,如辩论和讨论,除褒义、贬义、中性的情感外,还包含支持、反对(或争论)的现象。

5. 意图挖掘(意图≠情感)

I am dying to see Life of Pi.
I want to buy an iPhone.
I want to throw this camera out of the window.

6. 垃圾观点检测与评论质量

在评论数据中进行垃圾观点信息检测与过滤;
识别高质量用户评论,展示在网页靠前位置。

三、情感分析是个迷你自然语言处理任务

情感分析涉及了自然语言处理几乎所有的核心问题,例如:词汇语义、指代消解、词汇消歧、篇章分析、信息抽取、语义分析等。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值