问题定义:
观点(Opinion):观点是一个四元组(g, s, h, t),其中:g是观点针对的目标,s为情感倾向,正向、负向、中立会一个表示情感强度的浮点数,h为观点所有者,t为观点发表的时间。
实体(Entity):实体可以是一个产品、服务、事件、主题、人或组织等。用一个二元组(T,W)表示,其中T为实体或实体的一个方面Aspect,W为T的属性。
观点(Opinion):(e, a, s, h, t), 其中:e为观点针对的实体,a为实体的某个方面,s、h和t同上。
情感分析的任务:
给定一篇文档,从中找出所有的观点元组(e, a, s, h, t),可以分解为下面几个子任务:
1,实体抽取以及实体分类
2,方面抽取以及方面分类
3,观点持有者抽取和分类
4,时间抽取和标准化
5,方面情感分类
6,观点元组生成
示例:
(三星相机,画质,正向,John,2013-06-15)
(三星相机,电池,负向,John,2013-06-15)
(三星相机,整体,负向,John,2013-06-15)
观点总结:观点都是主观的,只看一个人的观点没什么意义,需要对大量人的观点进行Summary。最简单的方式就是对某个实体的各个Aspect统计正向和负向情感数
明确观点:如:可口可乐很好喝
隐含观点:如:我昨天喝了一瓶可乐,今天拉肚子了
客观语句:描述某种事实,如:Ipad是苹果公司的产品。客观语句也可能隐含某种情感倾向,如:这个车开了两天就坏了
主观语句:描述人们的某种感觉和观点,如:Ipad真酷
情感Emotion:是人们的某种感觉和思考。可分为:理智评价(Rational Evaluation)和情绪化评价(Emotional Evaluation),可用来em表明情感的强度,如
emotional negative –2
rational negarive –1
neutral 0
rational positive 1
emotional positive 2