本节通过一个电影推荐案例来介绍最简单的推荐模型——基于评分进行排序。
就如同豆瓣电影网页上的top10电影排行榜一样,我们根据IMDB网站的数据建立了一个top10电影榜单。
操作步骤如下:
(1)决定一个指标或分数,对电影进行评价;
(2)计算每一部电影的分数;
(3)根据分数对电影进行排序,输出top10排行结果。
使用的数据链接:IMDB电影评分数据
电影最基本的一个评价指标是电影评分,但是直接使用电影评分存在一个问题,譬如,一个冷门的电影,只有10个观众评价了,平均分为9分,另外一个电影,有100,000人评分,且平均分为8.9分,那么能够认为第一部电影比第二部电影评分高,并将它推荐给其他人吗?显然这样是有问题的。
考虑到上面的问题,采用以下评分公式:
其中,v是某电影参与评分的观众的个数,