本文介绍的论文是Recsys17上的“最佳论文”,题目是《Modeling the Assimilation-Contrast Effects in Online Product Rating Systems: Debiasing and Recommendations》,主要是建模了评分预测中的“同化-对比”效应(Assimilation-Contrast Effects),看完之后的感觉就是:
好了,趁着热乎劲,赶紧总结一波!可能有些细节没有理解到位,欢迎大家一起来交流讨论!
1、背景
在线评分系统对于电商、视频平台来说是非常重要的模块。用户对产品的评分可以帮助推荐系统作出更加准确的推荐,同时也会影响后面的用户对于该产品的购买决策,以及对于该产品的评分。
对评分系统来说,很重要的一点是能够获取到用户的一个无偏的评分。但是其他历史的评分会用户的评分产生影响,从而使得用户的评分不在是无偏的。从宏观的角度看,这种偏差会使得整个的历史评分分布偏离产品内在质量(这里我理解是这样的,假设评分对应1-5,产品质量也是1-5,那么如果评分是无偏的,那么质量为3的产品所对应的评分分布应该是均值为3的正态分布,而有偏的评分会使得这种分布的均值偏离3),这有可能误导用户做出错误的购买决策;从微观的角度看,评分的偏差会对推荐系统每次推荐结果的准确性造成一定程度的损失。
本文重点关注的是在微观层面,目标是在每次推荐的过程中去建模这种历史评分所带来的影响。
那么这种影响到底是什么呢?即所谓的“同化-对比”效应,我们在下一节中进行介绍。
2、“同化-对比”效应
2.1 数据集介绍
我们通过两个数据集来描述评分系统中的“同化-对比”效应。两个数据集分别是Amazon和TripAdvisor,其中,Amazon数据集中,主要关注四个最大的类别,分别是books, movies, electronics和clothes。数据集的概括描述如下:
接下来介绍一些符号定义:
接下来,我们来看看历史评分是如何影响当前评分的。影响用