推荐系统中的召回算法
定义
推荐策略的两个关键问题分别是“召回”和“排序”。“召回(match)”指从全量信息集合中触发尽可能多正确的结果,并将结果返回给“排序”
来源
全量商品与用户进行匹配排序,计算量无法支持。需要召回获得较小的商品候选集,再进行复杂模型的排序。
指标
召回率(recall),准确率(precision)
召回类型
- 基于内容匹配的召回(content-based)
- 基于协同过滤的召回(collaborative filtering)
协同过滤细分为:
a. 基于共现关系neighborhood(user-based,item-based)
b. 基于模型model-based
模型协同过滤细分为:
i. 传统SVD,FM
ii. 深度网络DNN(deepmatch),embedding(w2v, graph embedding)
base算法
item-based CF(i2i)
商品根据用户浏览表示成向量,例如商品A被用户a/b浏览,没有被用户c浏览,可以表示为(1, 1, 0)
计算两个商品的余弦相似度 similarity(A,B) = cos(A,B) = AB/||A||||B||
实际应用中,采用一个session内的用户行为来计算