slope one matlab代码,推荐算法——Slope one算法

Slope One最大优点在于算法很简单, 易于实现, 执行效率高, 同时推荐的准确性相对很高。Slope One来自Daniel Lemire和Anna Machlachlan的论文Slope One Predictors for Online Rating-Based Collaborative Filtering,有需要可以下载看一下。

5b9d8b7e0b07

Slope One paper.png

Slope One

其基本的想法来自于简单的一元线性模型 w=f(v)=v+b。已知一组训练点 (vi,wi)ni=1,利用此线性模型最小化预测误差的平方和:

5b9d8b7e0b07

so_1.png

利用上式获得了b的取值后,对于新的数据点vnew,我们可以利用 wnew=b+vnew 获得它的预测值。直观上我们可以把上面求偏移 b 的公式理解为 wi 和 vi 差值的平均值。

5b9d8b7e0b07

so_2.png

上图所示,定义item i 相对于 item j 的平均偏差:

5b9d8b7e0b07

Paste_Image.png

其中 Sj,i() 表示同时对item i 和 j 给予了评分的用户集合,而 card() 表示集合包含的元素数量。有了上面的定义后,我们可以使用

5b9d8b7e0b07

Paste_Image.png

获得用户 u 对 item j 的预测值。当把所有这种可能的预测平均起来,可以得到:

5b9d8b7e0b07

Paste_Image.png

其中 Rj 表示所有用户 u 已经给予评分且满足条件 (i≠j 且 Sj,i非空) 的item集合。对于足够稠密的数据集,我们可以使用近似

5b9d8b7e0b07

Paste_Image.png

把上面的预测公式简化为

5b9d8b7e0b07

Paste_Image.png

Weighted Slope One

Slope One中在计算 item i 相对于 item j 的平均偏差 devj,i 时没有考虑到使用不同的用户数量平均得到的devj,i,其可信度不同。假设有 2000 个用户同时评分了 item j 和 k,而只有20 个用户同时评分了 item j和 l,那么显然获得的 devj,k 比 devj,l 更具有说服力。所以一个修正是对最终的平均使用加权:

5b9d8b7e0b07

Paste_Image.png

5b9d8b7e0b07

Paste_Image.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值