关键术语
召回(Recall):
从已知数据集中找到符合条件的数据。
召回率 = 检索到相关的内容数量 / 系统所有相关的内容数量
精确率 = 检索到相关的内容数量 / 检索到所有的内容数量
排序(Ranking):
根据用户兴趣爱好对多个召回策略的结果进行排序
架构分析
三元组(用户ID,事件ID,用户评分),一般通过行为数据得到隐式反馈评分
召回阶段
召回阶段结果:[uid,aid] 每个用户对未访问物品的可能喜欢
特征阶段
排序阶段输入:[uid,aid]+uaerFeature+itemFeature
排序阶段
历史行为数据可以得到(uid,aid,1或0)用户喜不喜欢这个商品
ALS
ALS交替最小二乘``
设定两个固定矩阵,不停交替