情感分析history
- Breck,Choi, and Cardie 2007; Takamura, Inui, and Okumura 2007(单词)
- Yu andHatzivassiloglou 2003; Kim and Hovy 2004(句子)
- Pang, Lee, andVaithyanathan 2002; Turney 2002(文档)
- Hatzivassiloglou and McKeown 1997(提出了第一种确定形容词极性或方向(正,负和中性)的方法。该方法通过在大型文档集中检测由诸如‘and’和‘or’的连词连接的这些词对来预测形容词的方向。这种方法的缺点是依赖于连词关系,无法提取无连词的形容词。);
- Wiebe 2000; Wiebe et al. 2004(提出了一种方法,根据词类的分布相似性,使用词聚类的结果来找到主观形容词。但是,他们没有解决发现的主观形容词的情绪极性的预测。);
- Turney and Littman 2003(计算目标词的逐点互信息(PMI),每个种子的正负词都作为其语义关联的量度。他们的工作需要额外访问Web(或其他类似于Web的语料库以确保足够的覆盖范围),这很费时间);
- Kanayama and Nasukawa 2006; Kaji and Kitsuregawa 2007(基于语料库。他们的工作首先使用子句级上下文一致性来找到候选词,然后使用统计估计方法来确定候选者是否是适当的见解词。然而,如果种子词在数据中的出现频率很低,或者未知的意见词在其上下文中没有已知的意见词,他们寻找候选的方法的召回率就会很低。此外,如果语料库很小,统计估计可能会不可靠,这是统计方法常见的问题。)
- Kamps et al. 2004(在基于词典的方法中,Kamps等人。 (2004)利用WordNet的优势,通过连接成对的同义词来构建同义词网络。一个词的这些方向取决于它到两个种子词“好”和“坏”的最短路径,这两个词被选作正方向和负方向的代表。);
- Esuli andSebastiani 2005(使用文本分类技术对方向进行分类。他们的方法是基于在线“词汇表”或词典中的注释(文本定义)。);
- Takamura, Inui, and Okumura 2005(基于词典。Takamura、Inui和Okumura(2005)的工作也利用了词典中的词汇信息。如果一个词出现在另一个词的光泽中,则该方法通过链接两个词来构建词汇网络。链接的权重反映了这两个相连的单词是否具有相同的方向。)
- Hu and Liu 2004; Kim and Hovy 2004(Hu and Liu(2004)和Kimand Hovy(2004)的作品比较简单,因为它们仅使用同义词和反义词。然而,所有基于词典的方法都无法找到领域相关的情感词,因为词典中的大多数条目都是领域无关的。例如,在电影评论中,“不可预测的”通常是一个积极的评价词,就像在“不可预测的情节”中一样,但在汽车评论中,“不可预测的”很可能是负面的,就像在“不可预测的转向”中一样。);