贝叶斯个性化排序(BPR)算法详细推导

最新推荐文章于 2023-07-10 15:10:22 发布

hangshun-J

最新推荐文章于 2023-07-10 15:10:22 发布

阅读量1.2k

点赞数 4

文章标签：机器学习

本文链接：https://blog.csdn.net/JHSHUN/article/details/108908943

版权

1.前言

在很多推荐场景中，我们都是基于现有的用户和商品之间的一些数据，得到用户对所有商品的评分，选择高分的商品推荐给用户，这是funkSVD之类算法的做法，使用起来也很有效。但是在有些推荐场景中，我们是为了在千万级别的商品中推荐个位数的商品给用户，此时，我们更关心的是用户来说，哪些极少数商品在用户心中有更高的优先级，也就是排序更靠前。也就是说，我们需要一个排序算法，这个算法可以把每个用户对应的所有商品按喜好排序。BPR就是这样的一个我们需要的排序算法。

2.问题引入

假设U是用户集合，I是项目集合。在本模型中，隐式反馈 $\subseteq U \times I$ 是可用的。比如购买行为，点击流等等。我们的目标是提供给用户一个个性化的推荐排序 $>_u \subset I^2$ ，其中 $_u$ 必须满足如下性质：

$完整性：∀i,j∈I:i≠j⇒i>_{u}j∪j>_{u}i$
$反对称性：∀i,j∈I:i>_{u}j∩j>_{u}i⇒i=j$
$传递性：∀i,j,k∈I:i>_{u}j∩j>_{u}k⇒i>_{u}k$

同时，BPR也用了类似矩阵分解的模型，对于用户集 $U$ 和物品集 $I$ 对应的 $U \times I$ 的预测排序矩阵，我们期望得到两个分解后的用户矩阵 $W (∣ U ∣ \times k)$ 和物品矩阵 $H (∣ I ∣ \times k)$ ，满足:
$\overline{X}=WH^{T}$
对于任意一个用户u，对应的任意一个物品i，我们预测得出的用户对该物品的偏好计算如下：
$\overline{x}=w_{u}·h_{i}=\sum^{k}_{f=1}w_{uf}h_{if}$
最终我们的目标，是希望寻找合适的矩阵 $W$ ， $H$ ，让 $\overline{X}$ 和 $X$ 最相似。

3.BPR的算法原理

BPR 基于最大后验估计 $P (W, H ∣ > u)$ 来求解模型参数 $W$ , $H$ ，这里我们用 $θ$ 来表示参数 $W$ 和 $H$ , $_{u}$ 代表用户 $u$ 对应的所有商品的全序关系,则优化目标是 $P(θ|>_{u})$ 。根据贝叶斯公式，我们有：
$P(θ|>_{u})=\frac{P(>_{u}|θ)P(θ)}{P(>_{u})}$
由于我们求解假设了用户的排序和其他用户无关，那么对于任意一个用户u来说，P(>u)对所有的物品一样，所以有：
$P(θ|>_{u})∝P(>_{u}|θ)P(θ)$
公式中 $P(θ|>_{u})$ 是后验， $P(>_{u}|θ)$ 是似然， $P (θ)$ 是先验；其中theta为所求模型，具体包括：表示用户的隐含因子矩阵P，及表达物品的隐含因子矩阵Q。

这个优化目标转化为两部分。第一部分和样本数据集D有关，第二部分和样本数据集D无关

第一部分：

对于第一部分，由于我们假设每个用户之间的偏好行为相互独立，同一用户对不同物品的偏序相互独立，所以有：
$\prod_{u∈U}P(>_{u}|θ)=\prod_{(u,i,j)∈(U×I×I)}P(i>_{u}j|θ)^{δ((u,i,j)∈D)}(1−P(i>_{u}j|θ))^{δ((u,j,i)∉D)}$
其中，
$\begin{cases} 1& \text{if b is true}\\ 0& \text{else} \end{cases}$
根据上面说到的完整性和反对称性，优化目标的第一部分可以简化为：
$\prod_{u∈U}P(>_{u}|θ)=\prod_{(u,i,j)∈(U×I×I)}P(i>_{u}j|θ)$
而对于 $P(i>_{u}j|θ)$ 这个概率，我们可以使用下面这个式子来代替:
$P(i>_{u}j|θ)=σ(\overline{x}_{uij}(θ))$
其中 $\sigma$ 是logistic sigmoid函数，为了满足BPR的完整性，反对称性和传递性并且方便优化计算：
$σ(x)=\frac{1}{1+e^{−x}}$
现在我们的重点就转换到了优化 $\overline{x}_{uij}(θ)$ 上，而 $\overline{x}_{uij}(θ)$ 可以看做用户 $u$ 对 $i$ 和 $j$ 偏好程度的差异,我们当然希望 $i$ 和 $j$ 的差异越大越好，这种差异如何体现，最简单的就是差值：
$\overline{x}_{uij}(θ)=\overline{x}_{ui}(θ)−\overline{x}_{uj}(θ)$
而 $\overline{x}_{ui}(θ)$ ， $\overline{x}_{uj}(θ)$ ，就是我们的矩阵 $\overline{x}$ 对应位置的值。这里为了方便，我们不写θ,这样上式可以表示为:
$\overline{x}_{uij}=\overline{x}_{ui}−\overline{x}_{uj}$
最终，我们的第一部分优化目标转化为：
$\prod_{u∈U}P(>_{u}|θ)=\prod_{(u,i,j)∈D}σ(\overline{x}_{ui}-\overline{x}_{uj})$

第二部分

假设这个概率分布符合正太分布，且对应的均值是0，协方差矩阵是λθI，即
$P(θ)∼N(0,λ_{θ}I)$
对于上面假设的这个多维正态分布，其对数和 $θ||^{2}$ 成正比。即：
$lnP(θ)=λ_{θ}||θ||^{2}$

总结

最终对于我们的最大对数后验估计函数：
$lnP(θ|>_{u})$

$lnP(>_{u}|θ)P(θ)$

$=ln\prod_{(u,i,j)∈D}σ(\overline{x}_{ui}−\overline{x}_{uj})+lnP(θ)$

$=∑_{(u,i,j)∈D}(lnσ(\overline{x}_{ui}−\overline{x}_{uj})-λ_{θ}||θ||^{2})$

$=∑_{(u,i,j)∈D}(lnσ(\overline{x}_{ui}−\overline{x}_{uj})-λ_{θ}||p_{u}||^{2}-λ_{θ}||q_{i}||^{2}-λ_{θ}||q_{j}||^{2})$

$_{(u,i,j)∈D}(lnσ(p_{u}·q_{i}−p_{u}·q_{j})-λ_{θ}||p_{u}||^{2}-λ_{θ}||q_{i}||^{2}-λ_{θ}||q_{j}||^{2})$
其中 $λ_{θ}$ 为正则系数。对应的最小化问题变为：
$arg min ∑_{(u,i,j)∈D}(λ_{θ}||p_{u}||^{2}+λ_{θ}||q_{i}||^{2}+λ_{θ}||q_{j}||^{2}-lnσ(p_{u}·q_{i}−p_{u}·q_{j}))$
采用SGD求解上述最小化问题，分别针对 $p_{u}$ 、 $q_{i}$ 、 $q_{j}$ 求偏导如下：

$\frac{∂f}{∂p_{u}}=\frac{1}{1+e^{p_{u}·q_{i}−p_{u}·q_{j}}}(q_{j}-q_{i})+λp_{u}$

$\frac{∂f}{∂q_{i}}=\frac{-p_{u}}{1+e^{p_{u}·q_{i}−p_{u}·q_{j}}}+λq_{i}$

$\frac{∂f}{∂q_{j}}=\frac{p_{u}}{1+e^{p_{u}·q_{i}−p_{u}·q_{j}}}+λq_{j}$

模型迭代求解的公式如下：
$p_{u}=p_{u}-α(\frac{1}{1+e^{p_{u}·q_{i}−p_{u}·q_{j}}}(q_{j}-q_{i})+λp_{u})$

$q_{i}=q_{i}-α(\frac{-p_{u}}{1+e^{p_{u}·q_{i}−p_{u}·q_{j}}}+λq_{i})$

$q_{j}=q_{j}-α(\frac{p_{u}}{1+e^{p_{u}·q_{i}−p_{u}·q_{j}}}+λq_{j})$

其中 α 为学习速率。

4.算法流程

输入：训练集 $D$ 三元组，梯度步长 $α$ ，正则化参数 $λ$ ,分解矩阵维度 $k$ 。　　　　　　　　　　
输出：模型参数，矩阵 $W$ , $H$
1. 随机初始化矩阵 $W$ , $H$
2. 迭代更新模型参数：
$w_{uf}=w_{uf}+α(∑_{(u,i,j)∈D}\frac{1}{1+e^{\overline{x}_{ui}−\overline{x}_{uj}}}(h_{if}−h_{jf})+λw_{uf})$
$h_{if}=h_{if}+α(∑_{(u,i,j)∈D}\frac{1}{1+e^{\overline{x}_{ui}−\overline{x}_{uj}}}w_{uf}+λh_{if})$
$h_{jf}=h_{jf}+α(∑_{(u,i,j)∈D}\frac{1}{1+e^{\overline{x}_{ui}−\overline{x}_{uj}}}(−w_{uf})+λh_{jf})$
3. 如果 $W$ , $H$ 收敛，则算法结束，输出 $W$ , $H$ ，否则回到步骤2.
当我们拿到 $W$ , $H$ 后，就可以计算出每一个用户u对应的任意一个商品的排序分： $\overline{x}_{ui}=w_{u}∙h_{i}$ ，最终选择排序分最高的若干商品输出。