ALS推荐算法简介

ALS(交替最小二乘法)是推荐系统中常用的一种算法,通过分解打分矩阵来近似用户和物品的特征。本文介绍了ALS的基本原理、求解过程,包括基础的ALS、ALS-L2正则化、Stochastic Gradient ALS以及考虑隐式反馈的ALS-WR算法。此外,还探讨了ALS的优缺点,如适合大数据并发场景但对隐变量个数敏感。
摘要由CSDN通过智能技术生成

ALS(交替最小二乘法)

ALS (Alternating Least Squares) 交替最小二乘法。ALS 的核心是:打分矩阵R是近似低秩的。换句话说,一个打分矩阵 R 可以用两个小矩阵和的乘积来近似。其基本原理是如果有两个变量需要确定,那ALS先固定第一个变量,然后求解第二个变量。之后固定第二个变量,求解第一个变量。如此交替迭代直至收敛或者达到最大迭代次数。
ALS属于混合CF,同时考虑了user和item两个方面

1.1 原理推导

在推荐系统中,以淘宝为例,在建立用户-物品矩阵的时候,我们会发现物品种类异常丰富,在数据挖掘中,体现为数据的维度非常高,那么把所有的这些用户-物品数据建立一个评分矩阵,将其全部载入内存,然后计算用户vs用户的相似度,或者计算物品vs物品的相似度,导致计算量非常庞大。
那么如何给我们高维的数据降维呢?
ALS假设我们的评分矩阵能分解为两个小矩阵的乘积,“打分矩阵R(mn)”就可以由“用户喜好特征矩阵U(mk)”和“产品特征矩阵V(n*k)
R = U ∗ V T R=U*V^T R=UVT

M是用户数,n是物品数,k为隐含特征数

2.1.1 ALS

了解ALS的原理后,我们定义ALS的损失函数, 使得目标最小化:
L = ( R − U V T ) 2 L=(R-UV^T)^2 L=(RUVT)2
那么有两个未知变量该如何求解呢?
假设在这里只有一个未知变量,我们可以通过给未知参数求导,使得导数为0,便可求解。那么在这里,我们假设其中一个变量已知V,求解出另一个参数U后,然后假设U已知,然后求解V,如此不断迭代,直到满足阈值条件为止。这就是所谓的交替最小二乘法
首先,我们固定变量V, 对U进行求导,有:
∂ L ∂ U = − 2 ∗ ( R − U V T ) 2 \frac{\partial L}{\partial U}=-2*(R-UV^T)^2 UL=2(RUVT)2
= > U V T V = R V =>UV^TV=RV =>UVTV=RV
= > U = R V ∗ ( V T V ) − 1 =>U=RV*(V^TV)^{-1} =>U=RV(VTV)1
同理,我们固定变量U, 对V进行求导,有:
∂ L ∂ V = − 2 ∗ U T ∗ ( R − U ∗ V T ) 2 = 0 \frac {\partial L}{\partial V}=-2*U^T*(R-U*V^T)^2=0 VL=2UT(RUVT)2=0
= > U T R = U T U V T =>U^TR=U^TUV^T =>UTR=UTUVT
= > V T = ( U T U ) − 1 U T R =>V^T=(U^TU)^-1U^TR =>VT=(UTU)1UTR
= > V = R T U ( U T U ) − 1 =>V=R^TU(U^TU)^{-1} =>V=RTU(UTU)1
是实对称矩阵,实对称阵的转置等于本身( A T = A A^T=A AT=A),所以( U^TU)直接去掉转置符号。

2.1.2 ALS-L2正则化

加入正则化项是为了防止过拟合,正则化项对参数进行惩罚,缩小参数范围,从而提高模型的泛化能力。
在基础的ALS代价函数上上加入一个L2正则化项,那么ALS-L2为:
L A L S − L 2 = ( R − U V T ) 2 + λ ( ∣ U ∣ 2 + ∣ V ∣ 2 ) L_{ALS-L2}=(R-UV^T)^2+\lambda(|U|^2+|V|^2) LALSL2=(RUVT)2+λ(U2+V2)

按照7.1.1中推导算法原则,对U,V进行求解
首先,我们固定变量V, 对U进行求导,有:
∂ L ∂ U = − 2 ∗ ( R − U V T

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值