学习目标内容:
学习推荐系统里的多路召回,理解新闻推荐系统里的多路召回策略。
学习收获:
从学习手册里我们学习到多路召回策略的意思。
多路召回
“多路召回”策略,指采用不同的策略、特征或简单模型,分别召回一部分候选集,然后把候选集混合在一起供后续排序模型使用,可以明显的看出,“多路召回策略”是在“计算速度”和“召回率”之间进行权衡的结果。其中,各种简单策略保证候选集的快速召回,从不同角度设计的策略保证召回率接近理想的状态,不至于损伤排序效果。如下图是多路召回的一个示意图,在多路召回中,每个策略之间毫不相关,所以一般可以写并发多线程同时进行,这样可以更加高效。
刚学习的时候有点懵和不懂,去查找资料和多方面去理解,大概整体理解多路召回的意思了。
就比如:
平时通过搜索引擎去查找我们感兴趣的内容,还有就是用户其实并不清楚自己的需求,或者用户的需求很难用简单的关键词来描述,更甚者他需要符合自身特征或喜好的结果,因此就有了基于用户特征、口味、兴趣喜好等信息发现机制的推荐系统,物品的召回是推荐系统重要的一环。
其实召回模块根据用户和场景特征,从上百万上亿物料库中挑选用户可能感兴趣的物品,通过多种召回方法进行组合召回,最终得到用户的候选物品集,经过召回过滤,物品的数量大概有上百上千个,一般会使用简单的特征进行快速查询,比如从ES、HBASE等查询。
在我们这次新闻推荐系统中,也就是说可以使用多种不同的策略来获取用户排序的候选商品集合&#