一、学习目标
1.学习推荐系统的集成学习
2.认识各种对推荐系统的评价指标
二、混合推荐方法
相当于是将集成学习应用到推荐系统中,这样能提高系统的性能:
1.并行混合设计
与机器学习中的集成学习类似,使用加权方法或者投票方法对权衡各个推荐系统的重要性。
a)加权式
在加权式的并行混合设计中,如何设计权重是关键,可以采用以下方法:
b)切换式
切换的思想,就是从多个推荐系统中选择一个作输出,其他的忽略,于是关键在于要设计一个规则来决定推荐器的使用:
c)混合式
最简单的方法,由于推荐器的数量就不多,将所有推荐器的结果都展示出来,让用户自行决定:
例如:
2.流水线式混合设计
三、推荐系统评价指标
根据是否使用数据集分为两种:
显然,线上评价更反映实际情况,但指标不统一、消耗的金钱和时间更多。离线评价是我们下面主要讲的。
1.评分预测
将推荐系统任务看成一个分类任务,对比预测的商品的分数和真实数据集标注的分数的差距来评判:
好处:有数据集就能计算结果;坏处:两个指标的数值不能直观表明一个推荐系统的优劣,只能用于对比两个推荐系统的好坏。
2.top-N任务的PRF1
由于推荐系统只是推荐最优的n个商品,显然不用计算分数,只需要统计命中(Hit)的商品项就行。于是可以使用正确率P、召回率R和F1值来作评价指标:
3.关注排序的评价指标
由于推荐系统推荐商品,如果第一个很对,那么后面的商品意义不大。所以排序对推荐系统的评价结果很关键。
相关的指标有Rank Score,nDCG和平均正确率。
a)Rank Score
Rank Score的例子:
b)nDCG
例子:
c)平均正确率
四、总结
混合推荐系统可以理解成集成学习应用到推荐系统中。而推荐系统的评价指标与正常的机器学习指标不同,需要额外记忆。