推荐系统的常见方法总结

最新推荐文章于 2022-08-16 12:37:36 发布

joshualiunsw

最新推荐文章于 2022-08-16 12:37:36 发布

阅读量1.1k

点赞数

分类专栏：复习文章标签：推荐系统算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/joshualiunsw/article/details/52453845

版权

复习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1.Content based

TF-IDF

Term Frequency - Inverse Document Frequency

词频-逆向文件频率

倾向于过滤掉常见的词语，保留重要的词语

i 指术语（特征），j 指文件（项目）

D是文件（项目）的集合，分母部分指术语t出现过的文件的集合

这里的分子母分部分均指集合元素数量数量统计

通常选用得分最高的几个术语作为标签进行推荐

2.Collaborative

Collaborative Filtering 协同过滤

假设我们要推荐产品给用户x，

首先找到n个产品反馈相似的（评分、购买、反馈相似）其他的用户

通过这些用户对x的评价来进行推荐

寻找相似用户的方法

Jaccard 相关系数

J=|A∩B|/|A∪B|

Cosine similarity measure 余弦相似度

n维

Pearson correlation coefficient 皮尔森相关系数

或

注意这里求得的相似度可能为负值

3.Latent factor based

潜在因子算法

RMSE 均方根误差

Root Mean Square Error

此方法另外找时间详细描述

我认为其基本思想基于最小二乘法 http://blog.csdn.net/joshualiunsw/article/details/52223887

其实就是个多维的最小二乘

Regularization

正则化

主要的思想是避免预测向量（函数）过拟合，因此要限制pq的过大波动

通常的方法是在最小化的误差函数上加上参数值（梯度）的长度的影响

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。