ALS 交替最小二乘

最新推荐文章于 2024-05-16 22:44:07 发布

韦人人韦

最新推荐文章于 2024-05-16 22:44:07 发布

阅读量3.5k

点赞数 3

分类专栏：推荐系统文章标签：推荐系统矩阵分解机器学习 ALS

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ddydavie/article/details/83020600

版权

推荐系统专栏收录该内容

3 篇文章 0 订阅

订阅专栏

ALS算法是矩阵分解的一种，用于评分预测。

矩阵分解

假设我们有一批用户数据，其中包含m个User和n个Item, 用户和物品的关系是一个三元组，<user, item, rating>, 即用户对物品的评分，因此我们得到矩阵 $R_{m\times n}$ , 其中的元素 $r_{ui}$ 表示第u个用户对第i个item的评分。

1538020000484

评分矩阵通常规模很大，并且通常是稀疏矩阵，因为一个用户不可能给所有商品评分。矩阵中缺失的评分，称为missing item.

接下来将这个矩阵分解为两个子矩阵，使得两个子矩阵能近似得到原矩阵：

1538020213031

如下图所示，左边X矩阵实际代表用户的隐矩阵，即每个用户用一个k维向量表示，而右边的矩阵代表物品的隐矩阵，即每个物品用一个k维向量表示。k的值通常远小于n和m.

1538020466589

为了使低秩矩阵XY的乘积接近于R, 得到了我们的目标函数：

1538020553627

通常加入正则项，得到：

1538020590139

我们的目标就是优化上式，得到训练结果X, Y。预测时，我们只要将User和Item代入 $r_{ui}=x_u^Ty_i$ 就能得到相应的评分预测值。

此外，由于训练出了每个用户和物品的隐向量，因此根据向量比较User和Item之间的相似度。

ALS优化

直接优化公式2比较困难，因此需要用ALS中的核心概念：交替。先固定其他维度，只优化其中一个维度。

对 $x_u$ 求导，将 $y_i$ 当作常量，可得：

1538020965623

令导数为0，可得：

1538021322942

同理，对 $y_i$ 求导，由于X和Y是对称的，得到：

1538021355541

因此，整个迭代优化过程为：

随机生成X, Y

repeat until convergence {

固定Y, 使用公式3更新 $x_u$

固定X, 使用公式4更新 $y_i$

}

一般使用RMSE评估误差是否收敛：

1538021531707

算法复杂度：

求 $x_u$ : $O(k^2N+k^3m)$
求 $y_i$ : $O(k^2N+k^3n)$

可以看出来当k一定的时候，这个算法的复杂度是线性的。

因为这个迭代过程，交替优化X和Y，因此又被称作交替最小二乘算法（Alternating Least Squares，ALS）。

ALS与隐式反馈

隐式反馈与ALS的结合，有ALS-WR算法，即加权的ALS算法。

显示反馈：用户对商品的评分。

隐式反馈：用户对商品的行为，如点击，收藏，搜索，购买记录等。

隐式反馈的特点：

没有负面反馈，用户一般会直接忽略不喜欢的商品，而不是给予负面评价
隐式反馈包含大量噪声
隐式反馈难以量化
显式反馈表现的是用户的喜好（preference），而隐式反馈表现的是用户的信任（confidence）。比如用户最喜欢的一般是电影，但观看时间最长的却是连续剧。大米购买的比较频繁，量也大，但未必是用户最想吃的食物。

参考：

csdn: https://blog.csdn.net/antkillerfarm/article/details/53734658

关注

3
点赞
踩
14

收藏

觉得还不错? 一键收藏
1
评论
ALS 交替最小二乘

ALS算法是矩阵分解的一种，用于评分预测。矩阵分解假设我们有一批用户数据，其中包含m个User和n个Item, 用户和物品的关系是一个三元组，&lt;user, item, rating&gt;, 即用户对物品的评分，因此我们得到矩阵Rm×nR_{m\times n}Rm×n, 其中的元素ruir_{ui}rui表示第u个用户对第i个item的评分。评分矩阵通常规模很大，并且通常是稀疏...
复制链接

扫一扫

专栏目录

韦人人韦 CSDN认证博客专家 CSDN认证企业博客

码龄13年

42: 原创

17万+: 周排名

224万+: 总排名

31万+: 访问

: 等级

2184: 积分

143: 粉丝

305: 获赞

56: 评论

853: 收藏

私信

关注

热门文章

分类专栏

leetcode 19篇
Python 25篇
Java
Linux 1篇
Crowdsourcing
Django 1篇
Algorithm 18篇
Spring
Git 1篇
数据库 5篇
splunk 1篇
机器学习 8篇
hive 2篇
blog 1篇
推荐系统 3篇
latex 1篇
spark 1篇
tensorflow 1篇

最新评论

Ubuntu Tmux 启用鼠标滚动
tong_sun_njc: 将命令写在 ~/.tmux.conf中
Ubuntu Tmux 启用鼠标滚动
discusspro: 每次打开tmux都要设置啊？有没有设置一次就可以的方法？
Ubuntu Tmux 启用鼠标滚动
fgc346: Tips中，鼠标想要复制tmux窗口的内容，操作步骤为首先按下shrift，然后鼠标使用左键，选中要复制的内容，就可以将将其粘贴到其他位置。如果想要把其他地方的内容粘贴到tmux命令行界面，比如从网页中粘贴内容，可以执行 ctrl + shrift + v。
线性回归和逻辑回归的比较
F_Lancet_Authors: 博主你好，请问线性回归的系数可以和logistic回归的系数进行比较吗？
tf.concat中axis的含义与使用
liudinglldd: 会出现axis=3的情况吗？

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。