评论挖掘的论文调研

最新推荐文章于 2022-04-16 00:05:44 发布

Ding_xiaofei

最新推荐文章于 2022-04-16 00:05:44 发布

阅读量431

点赞数

分类专栏：文本处理

本文链接：https://blog.csdn.net/Ding_xiaofei/article/details/80393649

版权

文本处理专栏收录该内容

25 篇文章 2 订阅

订阅专栏

开篇

在acm和ieee的数据库里面搜了一大圈，最新的文章也是在15年左右了，感觉还是有点老，不过也不碍，毕竟他们的方法我肯定都是不知道的，过一过，也好了解一下大家以前的工作都在做些什么，下面的一些文章是不按照时间顺序来排列的，我看到那篇就会写那篇，最后有一些自己的总结。我是按照关键字搜索的，所以可能会有些偏题，请大家见谅。

Review Synthesis for Micro-Review Summarization

15年的wsdm

要解决的问题：本质上来讲还是文本的摘要，主要做的就是评论摘要，从全文的摘要来看，它希望是从原始的文本片段合成相应的摘要，抽象成一个np难问题，采用近似或者启发式的算法去求解相应的问题。
这里面涉及到两个概念，review和micro-review，review一般就是很长的，描述详细的，micro-review就是那种要点突出，简洁明了的，文章希望能够从短的review中抽取出实体，然后到长的review抽取出相应的片段去合成我们的摘要。

在生成摘要的过程中，需要保证两个特征，具有代表性和长度适中（太长就不是摘要了），找到这样的最佳摘要就是np难问题了。

review mining：与之相关的评论挖掘任务评论排序和评论选择（最大覆盖问题）

整体使用的方法是MDL，具体是什么方法没有细究，大家感兴趣可以去看一下。整体的思想还是抽取片段做相应的摘要合成

我关注的问题：如何去划分片段，怎么判断代表性和紧凑性

Extracting and Ranking Travel Tips from User-Generated Reviews

17年的www

要解决的问题：从少量的标准tip集中推出通用的模型用来抽取tips
解决问题的方式：典型的机器学习思维，整个文章读下来还是基本的有监督学习

首先是需要人为标注数据的，编辑需要做的是判断tips是否有用
抽取tips，人为建立了抽取的规则，抽出来是为了给编辑标注的（还顺带分析了一波什么样的特征的tip比较有用）
构建分类器（svm，逻辑回归）
tip ranking

Using Micro-Reviews to Select an Efficient Set of Reviews

CIKM2013
要解决的问题：使用micro-reviews去选择尽可能包含它内容的reviews
和第一篇是一样的作者，感觉内容相差不多

Selecting a Characteristic Set of Reviews

kdd2012
简书

总结

大概总结一下评论摘要的一些方法，基本是分成两个方面，片段合成和评论选择，像kdd这种就是单纯的评论选择，特征的提取全靠其他方法，标准靠整体的平均值，然后依靠特征去选择尽可能包含这些特征的评论来作为用户的参考。片段合成就靠tips来做，上面有两篇文章其实是出于同样的作者，其实还有第三篇一样的，内容大同小异，抽出与tip相对应的评论片段，然后去做合成，合成方法基本就是典型的约束优化算法，因为基本都是np难问题，所以采用近似或者启发式算法去解。
还有第三类，人力成本很高的，标注党，就想17年的www，任务是生成tips，机器用不同的方法去拆解句子生成tips，人为标注一些数据，然后把它变成有监督的二分类问题。

Ding_xiaofei

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
评论挖掘的论文调研

开篇在acm和ieee的数据库里面搜了一大圈，最新的文章也是在15年左右了，感觉还是有点老，不过也不碍，毕竟他们的方法我肯定都是不知道的，过一过，也好了解一下大家以前的工作都在做些什么，下面的一些文章是不按照时间顺序来排列的，我看到那篇就会写那篇，最后有一些自己的总结。我是按照关键字搜索的，所以可能会有些偏题，请大家见谅。Review Synthesis for Micro-Review ...
复制链接

扫一扫