推荐系统的常见方法总结

1.Content based

TF-IDF

     Term Frequency - Inverse Document Frequency

     词频-逆向文件频率


     倾向于过滤掉常见的词语,保留重要的词语


     

     i 指术语(特征),j 指文件(项目)

     

     D是文件(项目)的集合,分母部分指术语t出现过的文件的集合

     这里的分子母分部分均指集合元素数量数量统计

     


     通常选用得分最高的几个术语作为标签进行推荐

2.Collaborative

     

     Collaborative Filtering 协同过滤

     假设我们要推荐产品给用户x,

     首先找到n个产品反馈相似的(评分、购买、反馈相似)其他的用户

     通过这些用户对x的评价来进行推荐

     

     寻找相似用户的方法

     Jaccard 相关系数

     

     J=|A∩B|/|A∪B|


     Cosine similarity measure 余弦相似度

             n维

     

      Pearson correlation coefficient 皮尔森相关系数

      

     或

     

     注意这里求得的相似度可能为负值


3.Latent factor based

     潜在因子算法

     RMSE 均方根误差

     Root Mean Square Error

     

     此方法另外找时间详细描述

     我认为其基本思想基于最小二乘法 http://blog.csdn.net/joshualiunsw/article/details/52223887

     其实就是个多维的最小二乘

     Regularization

     正则化

     主要的思想是避免预测向量(函数)过拟合,因此要限制pq的过大波动

     通常的方法是在最小化的误差函数上加上参数值(梯度)的长度的影响

     

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值