情感分析Sentiment Analysis and Opinion Mining Bing Liu 阅读笔记——chapter3

最新推荐文章于 2021-06-08 21:11:33 发布

xiangrikuidweixiao

最新推荐文章于 2021-06-08 21:11:33 发布

阅读量1.9k

点赞数 1

分类专栏：情感分析文章标签：情感分析自然语言处理

本文链接：https://blog.csdn.net/sinat_28058359/article/details/81705277

版权

本文详细介绍了情感分析的文本情感分类，包括有监督学习中的二分类问题、词袋模型和SVM应用，以及无监督学习中的Turney方法。此外，还探讨了情感打分预测、跨领域和跨语言的情感分类挑战，强调了在不同数据类型和语言环境中的适应性和应用。

摘要由CSDN通过智能技术生成

文本情感分类

文档层面的情感分类：整篇文档general
问题定义：如果情感s是两级的，那就是分类问题，如果是实数值或者是依次的打分，类似1-5评分，那就是回归问题。
假设：情感分类or回归问题假设意见文档d（如一个产品的评论）表达的是对单一实体e的意见，包含来自一个单一的观点持有者的意见。
因为，如果一个意见文档评价了多个实体，对于不同实体的意见可能不同，比如，对一部分实体持有positive意见，另一部分negative，因此，在这种情况下，为整个文档分配一个情绪方向没有实际意义。如果多个意见持有者在单个文档中表达意见也没有多大意义，因为他们的意见也可能不同。
这种假设对于商品和服务的评价类的数据成立，因为这种类型的数据一般只专注于评价一种单一的产品或服务，而且一般是一个单一的评价者做出的评价。然而，对于forum，blog这样的数据类型，在一篇帖子中作者可能会对多个实体进行评价，并用比较句子对它们进行比较。

二分类问题，可以将打分转化为二分类问题（或者三分类），比如，1、2分是negative，3是中性，4、5是positive。

本质上是文本分类任务，但是传统的文本分类是按照话题划分，与话题相关的词是关键特征，在情感分类中，指示情感是p还是n的词语很重要。