基于属性的情感分析(Aspect Based Sentiment Analysis)是一种在给定的语料库中同时提取(co-extracting )表达意见和(事物)属性/方面术语(意见目标)以及它们之间的关系的任务。
算法概览
训练:训练阶段输入训练数据,并输出意见词典(opinion lexicon)和属性词典(aspect lexicon)。 总体说来,训练流程包括以下三个主要步骤:
- 1.第一个训练步骤是由Spacy执行的文本预处理。 此步骤包括标记化(tokenization)、词性标注(part-of-speech tagging)和语句切割(sentence breaking)。
- 2.第二个训练步骤是将依赖性解析器应用于训练数据。 为此,我们使用了论文1中描述的解析器。有关步骤1和2的更多详细信息,请参阅BIST依赖解析器。
- 3.第三步是基于使用论文2中描述的bootstrap词典获取算法(a bootstrap lexicon acquisition algorithm),该算法使用由论文3引入的通用词典(a generic lexicon)作为bootstrap过程的初始步骤。
- 4.最后一步包括应用基于MLP(多层感知器)的意见词组重新排序(opinion term re-ranking )和极性估计算法(polarity e