前言
Aspect based Sentiment Analysis(ABSA)任务中,大部分论文都用到了SemEval2014中的数据,这里总结介绍一下SemEval2014-task4。
SemEval简介
SemEval是国际语义评测大会,是全球范围内影响力最强、规模最大、参赛人数最多的语义评测竞赛。
SemEval2021比赛官网入口
Task描述
SemEval2014-task4 ABSA任务关注的领域是NLP中的细粒度情感分析,即给定一个句子判断其中的aspect以及它的情感极性。数据是基于laptop评论和restaurant评论,包括4个子任务分别是:
Aspect term extraction(SB1)
Aspect term polarity(SB2)
Aspect category detection(SB3)
Aspect category polarity(SB4)
对于SB1和SB2提供了laptop和restaurant数据,而对于SB3和SB4只提供了restaurant数据。
1.Aspect term extraction(SB1): 这个任务是识别句子中的aspect term,比如句子”Our waiter was friendly and it is a shame that he didn’t have a supportive staff to work with.”中的aspect term有waiter与staff。
2. Aspect term polarity(SB2):这个任务是在给定aspect term的情况下判断aspect term情感极性(positive/negative/conflict/neutral) 当句子对aspect term表达的情感既有积极又有消极的时候该aspect term的情感极性为conflict。
3. Aspect category detection(SB3):这个任务是首先预定义一个aspect categories的集合比如”price,food”等,之后判断哪一个aspect出现在了句子中。例如,句子”Delicious but expensive”中food和price并没有显示出现,但是可以通过delicious和expensive来推断出来。
4. Aspect category polarity(SB4):这个任务是对于一个句子给定aspect categories,之后判断该aspect category的情感极性(positive/negative/conflict/neutral)。
标注过程
对于laptop和restaurant数据集都需要标注aspect term(SB1),aspect term polarity(SB2)。而restaurant需要额外标注aspect category(SB3)和aspect category polarity(SB4)。标注者用的是BRAT标注工具,如下图所示:
从图中可以看出标注了4个aspect term(appetizer,salads,steak,pasta)与一个aspect category(food)。对于aspect category,这个句子都被加了标签。
标注结果
SemEval2014 task4的数据入口
参考文献
[1]https://zhuanlan.zhihu.com/p/81062536
[2] SemEval-2014 Task4_Aspect Based Sentiment Analysis,
[3]https://www.aclweb.org/anthology/S14-2004/
最后欢迎大家关注我的公众号:NLP学习者