推荐系统基础知识

推荐系统基础知识
推荐系统就是联系用户和物品,解决信息过载问题。一个完整的推荐系统一般存在三个参与方:用户、物品提供者、提供推荐系统的网站。
基于三方从不同角度出发,提出不同的指标,这些指标包括准确率、覆盖率、用户满意度、新颖度、惊喜度、信任度、透明度实时性、健壮性等,这些指标的有的可以通过离线实验计算、用户调查问卷、在线实验,一个推荐系统的成功上线需要完成这三个以上步骤。
准确率:预测评分,可以退通过均方根误差(RMSE)、平方绝对误差(MAE)计算;TOPN推荐,可以通过准确率/召回率度量;
覆盖率:描述一个推荐系统对长尾的发掘率,可以通过信息熵和基尼系数;
多样性:可以用推荐列表中物品两两之间的不相似性表示;
推荐方法:基于邻域的算法(可分为基于用户的协同过滤算法UserCF、基于物品的协同过滤算法ItemCF)、LFM(latent factor model)隐语义模型、基于图的模型
UserCF:找到和目标用户兴趣相似的用户集合,再找到这个集合中用户喜欢的,且目标用户没有听说过的物品推荐给目标用户,重点在于相似度的计算可以通过Jaccard公式或者余弦相似度进行计算,为了计算相似度,线=先建立用户和物品之间的倒排表,再建立用户相似度矩阵。得到相似度后会给目标用户推荐和他兴趣最相似的K个用户喜欢的物品.
User-IIF:是UserCF的改进算法,改进之处在对相似度的改进,有些必需品,每个人都会买,但不能表示他俩都对这个给感兴趣,所以会有影响兴趣相似度,这里惩罚了用户u和用户v共同兴趣列表中人们物品对他们相似度的影响
ItemCF:计算物品之间的相似度,根据物品的相似度和用户的历史行为给用户生成推荐列表。
Item-IUF:ItemCF的改进,降低了活跃用户度对物品相似度的影响
ItemCF-Norm:对相似度矩阵做了归一化处理,
基于领域的算法在覆盖
隐语义模型:采取基于用户行为统计的自动聚类(机器学习的方法)
基于图的模型:将用户行为表示为二分图模型,然后度量图中两个顶点之间的相关性,两个顶点之间的相关性可以用两个顶点之间的路径多少,路径长度长短,路径经过顶点出度大小来度量。基于随机游走的PersonalRank算法

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值