作者 | 张相於
为了文章的简洁性,本文省略了大量原文的文字和图片,只保留了笔者认为比较核心的内容,对原文有兴趣的同学欢迎阅读原文。
这篇文章讲述了Netflix对用户看到的视频封面进行个性化筛选的方法,但更具有普适性意义的是以此案例为载体的contextual bandit exploration方法,以及基于replay的离线效果无偏评估方法。
What & Why
本文要解决的核心问题是在Netflix的推荐系统中,为给用户推荐的每部剧集选择不同的封面图片,以提高用户的点击和观看时长。为什么需要将展示图片做个性化呢?因为剧集的题目很多时候并不足以给出足够的信息,以吸引用户的观看,而如果图片能够投其所好的话,则可以提高用户感兴趣的概率。有的用户喜欢某个演员,那么在剧集图片里展示该演员的剧照会更有效;有的演员喜欢喜剧,那么通过图片来告诉用户这是一部喜剧,则更有可能吸引用户;此外,不同用户可能有着不同的审美,那么对其展示更符合其审美的图片也会有更好的效果。
Challenges
第一个挑战,在于每个剧集只能展示一张图片,如果用户点击并观看了这部剧集,我们并不能确认是因为图片选得好起了作用,还是用户无论如何都会观看这部剧集。用户没有点击的情况也是类似。所以第一个要解决的问题时如何正确地对结果进行归因,对于确定算法的好坏至关重要。
第二个挑战,在于正确理解session之间切换展示图片的影响。所谓切换,指的是用户第一次看到这个剧集时使用的是图片A,后面经过算法学习,在第二次看到时使用了图片B。这种做法是好还是坏呢?坏的一面在于ÿ