The TagAdvisor: Luring theLurkers to Review Web Items -2015 sigmod
一、 问题定义
问题:用户进行在线评论所作出的反馈对于所有类型的企业来讲是一笔无限的财富,那么根据网络1/9/90原则,有大约百分之九十的用户只会观赏内容,浏览评论,懒得去参加讨论,对某一件商品或一项服务作出评论。那么我们通过从已有用户所留下的n个标签中提取出Top-K的标签去满足某个用户的需求,吸引并且方便一些潜在的用户去做出评论,这是本篇论文主要解决的问题。
二、 论文的方法
1、 首先对网上某件产品的评论数据构建模型,用一元组<U,I,T>来表示,然后用基于规则的分类器对这些数据进行处理,产生一个规则集合。并对规则集合构建图模型。我们用三个特征来描述所选择出来的Top-K个标签,a)相关性分数;b)覆盖范围,每一个标签都和某个属性集合相关;c)极性:来描述用户的积极情绪和消极情绪所占的比例。
2、 为了满足现实生活中不同情况,作者提出来两个具体的问题实例,1)独立覆盖标签推荐问题,该问题对应于标签和情感可以相互区分的情况;2)依赖覆盖标签推荐问题,该问题对应于标签和情感混合在一起的情况,也就是说我们可以对某一项属性做出积极的和消极的评价。那么这两个问题都分别对相关性分数、覆盖范围、极性提出了相应的限制。
3、 两个问题都是NPH问题,作者分别提出了两个2-近似算法,时间效率要高于精确算法,并且结果集和精确结果集的质量保持接近。
4、 优点:
a). 首先返回的Top-K个标签与用户所要评论的产品是相关的;
b).Top-K个标签都附带有相应的情感;
c).Top-K个标签可以覆盖该产品属性的多个方面。