推荐系统实战

最新推荐文章于 2022-10-02 20:53:37 发布

weixin_33755649

最新推荐文章于 2022-10-02 20:53:37 发布

阅读量64

点赞数

文章标签：数据结构与算法系统架构

原文链接：http://www.cnblogs.com/zhenjing/archive/2012/09/26/recommendation_system.

版权

推荐算法：基于特征的推荐算法

集合相似度度量公式(N维向量的距离度量公式)：

Jaccard公式：

其中，N(u)表示用户u有过正反馈的物品集合。

余弦相似度公式：

UserCF公式：

其中，S(u,k)表示和用户u兴趣最接近的K个用户集合；N(i)表示对物品i有过正反馈的用户集合；w(u,v)表示用户u和用户v的兴趣相似度；r(v,i)表示用户v对物品i的兴趣。默认取r(v,i)=1或0。

视角：用户即是特征。完全的个性化，每个用户都是唯一的，每个用户表示一维的特征。用户数量即是特征空间的维度，用户特征表示成TU(u)={0,0,0, ... , 1, ..., }，t(u, u)=1, 其余为0。对于物品的特征向量TI(j)={0, 1, 1, 1, 0, ... , ...}, 凡购买物品i的用户维度特征均为1。进一步，物品的特征空间可用用户购买的次数表示。相似度w(u,v)看成相应维度特征的加权值。

ItemCF公式：

其中，S(i,k)表示和物品i最相似的K个物品集合；N(u)表示用户喜欢的物品集合；w(i,j)表示物品i和物品j的相似度；r(u,i)表示用户u对i物品的兴趣。默认取r(u,i)=1或0。

视角：物品即是特征。每个物品都是唯一的，每个物品表示一维的特征。物品数量即是特征空间的维度，物品特征表示成TU(u)={0,0,0, ... , 1, ..., }，t(u, u)=1, 其余为0。对于用户的特征空间TI(j)={0, 1, 1, 1, 0, ... , ...}, 凡购买物品i的维度特征均为1。进一步，物品的特征空间可用用户购买的次数表示。相似度w(i,j)看成相应维度特征的加权值。

LFM公式：

其中，F表示隐类数量；p(u,k)表示用户u对第k个隐类的兴趣度；q(i,k)表示第k个隐类和物品i的相似度。Alpha表示学习速率；lamda表示正则化参数。

视角：LFM的公式就是典型的特征向量空间和特征加权矩阵的泛化表示形式。

TagCF公式：

n(u,b)表示用户u打过标签b的次数；n(b,j)表示物品i被打过标签的次数。

视角：标签即是特征。

关系链推荐公式：

其中，F(u)表示用户u的好友集合；w(u,v)可表示用户u和v的熟悉程度(共同好友数)，也可表示用户u和v兴趣的相似度(UserCF定义)，也可是二者的综合度量；r(v,i)表示用户v对物品i的兴趣。默认取r(v,i)=1或0。

视角：好友是特征，或者好友兴趣是特征。

信息流推荐公式：

其中，信息流i的边e表示其他用户对信息流i产生行为；E(e)表示和信息流i边的集合；v(e)表示用户v和当前用户u的相似度(熟悉度)；w(e)表示边类型的权重；d(e)表示边e的时间衰减参数。

推荐系统架构

实际推荐系统通常采用多种推荐算法，并根据用户的实时行为反馈调整用户的特征向量(特征的加权系数)，进而融合各个推荐算法的推荐结果，在此基础上过滤不要的推荐项，最后结合用户使用场景调整推荐结果排名，给出最终推荐结果。

基于不同特征的推荐算法经常采用定期计算、定期更新特征物品推荐表，比如基于Item的相似度特征，可保存每个item最相关的K个Item；基于用户，保留每个用户最近的N个item；基于基于tag特征，保存每个tag最多次数的M个item；基于用户年龄特征，保存每个年龄段最热门的N个Item；基于用户like，保存各个用户最近喜欢的N个item，或最喜欢的M个类别……

用户的实时行为反馈和用户当前场景都将实时影响最终的推荐结果，用户的实时反馈可直接影响推荐结果融合，而用户的场景将决定推荐结果的排序和展示。同时用户的反馈也将影响离线计算的物品推荐数据。

参考文献：

推荐系统实践 -- 项亮 2012

Hulu’s Recommendation System

转载于:https://www.cnblogs.com/zhenjing/archive/2012/09/26/recommendation_system.html

weixin_33755649

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
推荐系统实战

推荐算法：基于特征的推荐算法推荐算法准确度度量公式：其中，R(u)表示对用户推荐的N个物品，T(u)表示用户u在测试集上喜欢的物品集合。集合相似度度量公式(N维向量的距离度量公式)：Jaccard公式：其中，N(u)表示用户u有过正反馈的物品集合。余弦相似度公式：UserCF公式：其中，S(u,k)表示和用户u兴趣最接近的K个用户集合；N(i)表...
复制链接

扫一扫