推荐系统(基本方法+评估指标+工具)

本文介绍了推荐系统的三种基本方法:基于邻居的方法、矩阵分解和针对隐式反馈的矩阵分解。针对评估指标,讲解了误差、百分位排名和Hit Ratio @ N。最后提到了用于优化的SGD和ALS工具,以及推荐系统工具的资源链接。
摘要由CSDN通过智能技术生成

基本方法

1 Neighborhood-based (item-item)

参考文献:Item-based Collaborative Filtering Recommendation Algorithms

根据与item i 相似的 k 个 items,估计出对item i 的评分。采用加权平均的方法,如下,

sij 为 item i 与 item j 的相似度, rui 为 user u 对 item i 的评分。

r̂ ui=jSk(i;u)sijrujjSk(i;u)sij

相似度的计算有多种方式,例如余弦相似度,皮尔森相关系数等。

cosine

corelation

当然,还可以用 user-user 估计,但是users 数目往往很大,不适合较大规模数据。

2 Model-based (矩阵分解)

参考文献:Matrix Factorization Techniques for Recommender Systems

基于相似度的方法只能找出相似的items,意味着向一个看了动作片的人推荐更多动作片。但现实情况是,喜欢看动作片的人可能不仅仅喜欢动作片,也喜欢爱情片,或者爱情动作片。这就需要挖掘出潜在因素来进行推荐(latent factors)。

将 user-item 评分矩阵分解为 user_features x item_features。

这里写图片描述

由于R矩阵是非常稀疏的,有大量缺失值,如果使用传统SVD分解需要填补缺失值。这样做有两个缺点:1. 填补什么值?会造成不准确;2. 填补后变成稠密矩阵,计算量大增。于是采用忽略缺失值的方法,最小化 least square。但要注意防止 overfitting,加入正则化项(与模型复杂度成正比)。<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值