【PMI-IR】Semantic Orientation Applied to Unsupervised Classification of Reviews

**

Thumbs up or thumbs down? Semantic Orientation Applied to Unsupervised Classification of Reviews.[PMI-IR–2002.7]

**
In this paper, author proposed a simple unsupervised learning algorithm PMI-IR to classifying a review as recommended or not recommended. PMI-IR uses Pointwise Mutual Information(PMI) and Information Retrieval(IR) to measure similarity of pairs of words or phrases. It has three steps: first is to use part-of-speech tagger to identify and extract phrases containing adjectives or adverbs. Then to estimate the semantic orientation of each phrase(PMI->SO(IR)). Finally is to classify the review based on the average semantic orientation of the phrases(average).

It shows that this algorithm achieves an average accuracy of 74% when evaluated on 410 reviews from Epinions, sampled from 4 different domains(automobiles, bank, travel destination and movies). From this 4 different domains, automobiels and banks has a better performance, with the accuracy of 84% and 80% respectively. While movies has the worse performance, and the explaination is sometimes positive reviews mention unpleasant things and negative reviews often mention pleasant things because of different plots.

The advantage of this algorithm is that it can improve the accuracy, but it also has some limitations. First one is that it is time consuming since it need to send queries to AltaVista(now it is shut down). And second is to some specific domain, this algorithm cannot perform that well, maybe in the future it is a good idea to combine semantic orientation with other features in a supervised classification algorithm.

文中的术语/方法:

  • LSA (Latent Semantic Analysis): 潜在语义分析,它使用统计计算的方法对大量的文本集进行分析,从而提取出词与词之间潜在的语义结构,并用这种潜在的语义结构,来表示词和文本,达到消除词之间的相关性和简化文本向量实现降维的目的,即把高维的向量空间模型(VSM)表示中的文档映射到低维的潜在语义空间中。这个映射是通过对项/文档矩阵的奇异值分解(SVD)来实现的。
    该方法和传统向量空间模型(vector space model)一样使用向量来表示词(terms)和文档(documents),并通过向量间的关系(如余弦相似度)来判断词及文档间的关系;而不同的是,LSA将词和文档映射到潜在语义空间,从而去除了原始向量空间中的一些“噪音”,提高了信息检索的精确度。
    步骤:
    (1)分析文档集合,建立term-document矩阵
    (2)奇异值分解该矩阵
    (3)分解后的矩阵进行降维
    (4)用将为后的矩阵来构建潜在语义空间,或重建term-document矩阵

  • PMI-IR
    在这里插入图片描述
    PMI部分跟正常PMI相同(详细介绍在SO-PMI部分),但是SO是通过IR确定的,之前的SO是通过考虑不同情感词之间的共现距离(正负词是事先指定好的种子词),而此文是通过搜索引擎返回的结果来计算某一情感要素词和一个参考词(正,负;事先指定种子词)的差值来测定词语的语义倾向性:
    在这里插入图片描述

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PMI-PBA 商业分析指南 epub 是指由美国项目管理协会(PMI)发布的关于商业分析的指南的电子出版物。这个指南向商业分析师提供了一系列的最佳实践和工具,帮助他们在项目中发挥重要的角色。它提供了详细的步骤和方法,帮助分析师从定义业务需求、规划和管理商业分析活动、收集和分析数据、编写需求文档以及与利益相关者沟通等方面进行有效的商业分析。 通过 PMI-PBA 商业分析指南 epub,商业分析师可以掌握以下几个方面的核心内容: 1. 商业分析框架:指南中介绍了一种实用的商业分析框架,帮助分析师组织和执行商业分析的各个环节。这包括确定业务需求、识别问题和机会、进行需求规划和管理、实施需求分析和解决方案评估等。 2. 工具和技术:指南提供了各种商业分析工具和技术的介绍和使用指引,例如SWOT分析、需求优先级评估、流程建模、数据建模等。这些工具和技术可以协助分析师进行准确和全面的分析,确保项目的成功实施。 3. 利益相关者管理:指南重点强调了利益相关者的重要性,提供了有效的方法来识别、分析和管理利益相关者。这样可以确保利益相关者的需求和期望得到满足,增加项目成功的概率。 4. 总体概念和定义:指南对商业分析的整体概念和定义进行了详细阐述,帮助分析师全面理解商业分析的核心价值和目标。 总而言之,PMI-PBA 商业分析指南 epub 提供了一个综合和系统的框架,帮助商业分析师在项目中做出有力的决策,确保利益相关者的期待得到满足,从而实现项目的成功。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值