评论挖掘的论文调研

开篇

在acm和ieee的数据库里面搜了一大圈,最新的文章也是在15年左右了,感觉还是有点老,不过也不碍,毕竟他们的方法我肯定都是不知道的,过一过,也好了解一下大家以前的工作都在做些什么,下面的一些文章是不按照时间顺序来排列的,我看到那篇就会写那篇,最后有一些自己的总结。我是按照关键字搜索的,所以可能会有些偏题,请大家见谅。

Review Synthesis for Micro-Review Summarization

15年的wsdm

要解决的问题:本质上来讲还是文本的摘要,主要做的就是评论摘要,从全文的摘要来看,它希望是从原始的文本片段合成相应的摘要,抽象成一个np难问题,采用近似或者启发式的算法去求解相应的问题。
这里面涉及到两个概念,review和micro-review,review一般就是很长的,描述详细的,micro-review就是那种要点突出,简洁明了的,文章希望能够从短的review中抽取出实体,然后到长的review抽取出相应的片段去合成我们的摘要。

在生成摘要的过程中,需要保证两个特征,具有代表性和长度适中(太长就不是摘要了),找到这样的最佳摘要就是np难问题了。

review mining:与之相关的评论挖掘任务评论排序和评论选择(最大覆盖问题)

整体使用的方法是MDL,具体是什么方法没有细究,大家感兴趣可以去看一下。整体的思想还是抽取片段做相应的摘要合成

我关注的问题:如何去划分片段,怎么判断代表性和紧凑性

Extracting and Ranking Travel Tips from User-Generated Reviews

17年的www

要解决的问题:从少量的标准tip集中推出通用的模型用来抽取tips
解决问题的方式:典型的机器学习思维,整个文章读下来还是基本的有监督学习

  • 首先是需要人为标注数据的,编辑需要做的是判断tips是否有用
  • 抽取tips,人为建立了抽取的规则,抽出来是为了给编辑标注的(还顺带分析了一波什么样的特征的tip比较有用)

  • 构建分类器(svm,逻辑回归)

  • tip ranking

Using Micro-Reviews to Select an Efficient Set of Reviews

CIKM2013
要解决的问题:使用micro-reviews去选择尽可能包含它内容的reviews
和第一篇是一样的作者,感觉内容相差不多

Selecting a Characteristic Set of Reviews

kdd2012
简书

总结

大概总结一下评论摘要的一些方法,基本是分成两个方面,片段合成和评论选择,像kdd这种就是单纯的评论选择,特征的提取全靠其他方法,标准靠整体的平均值,然后依靠特征去选择尽可能包含这些特征的评论来作为用户的参考。片段合成就靠tips来做,上面有两篇文章其实是出于同样的作者,其实还有第三篇一样的,内容大同小异,抽出与tip相对应的评论片段,然后去做合成,合成方法基本就是典型的约束优化算法,因为基本都是np难问题,所以采用近似或者启发式算法去解。
还有第三类,人力成本很高的,标注党,就想17年的www,任务是生成tips,机器用不同的方法去拆解句子生成tips,人为标注一些数据,然后把它变成有监督的二分类问题。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值