推荐算法架构
- 召回 - > 排序 - > 策略调整 - >
推荐模型构建流程
- 数据收集
- 显性评分
- 隐形数据 - 特征工程
- 协同过滤 用户-物品 评分矩阵
- 基于内容 分词 tf-idf word2Vec - 训练模型
- 协同过滤
- KNN
- 矩阵分解 - 评估、模型上线
协同过滤思路介绍
- CF 物以类聚人以群分
- 做系统过滤的话 首先特征工程要把用户-物品的评分矩阵创建出来
- 基于用户的协同过滤
- 给用户A找到最相似的N个用户
- N个用户消费过哪些商品
- N个用户消费过的物品中减去A用户消费过的就是推荐结果 - 基于物品的协同过滤
- 给物品A找到最相似的N个物品
- A用户的消费记录 找到这些物品的相似物品
- 从这些相似物品中先去重减去A用户消费过的就是推荐结果
相似度计算
- 余弦相似度, 皮尔逊相关系数
- 向量的夹角余弦值
- 皮尔逊会对向量的每一个分量做中心化处理
- 余弦只考虑方向 不考虑向量长度
- 如果评分数据是连续的数值比较适合中余弦、皮尔逊计算相似度 - 杰卡德相似度
- 交集/并集
- 计算评分是0 1布尔值的相似度