【推荐系统算法】DPMF(Dependent Probabilistic Matrix Factorization).上篇

本文介绍了DPMF(Dependent Probabilistic Matrix Factorization)算法,该算法在基础PMF上引入辅助信息,如球队球员买卖、伤病情况,通过高斯过程相关性描述球队内部特征。DPMF模型利用高斯随机过程和二元高斯分布,处理如篮球比赛得分矩阵,考虑主客场等因素的影响。模型中,特征矩阵U和V表示球队的攻防能力,隐变量f与辅助信息x相关,参数通过高斯过程和Cholesky分解描述相关性。
摘要由CSDN通过智能技术生成

Adams, Ryan Prescott, George E. Dahl, and Iain Murray. “Incorporating
side information in probabilistic matrix factorization with gaussian
processes.” arXiv preprint arXiv:1003.4944 (2010).

对“PMF”这个概念比较陌生的同学请先阅读这篇基础PMF算法
对“利用MCMC方法积掉后验概率”这句话感到费解的同学可以参看这篇贝叶斯PMF算法

在PMF中,使用一个关系矩阵 Z Z Z来描述用户对电影的评分。但除了这个基本信息之外,还有一些辅助信息:用户的身份、在网页上的操作、电影的票房、打分发生的时间等。
再以篮球比赛为例, Z Z Z矩阵存储球队间竞赛得分。而球队球员买卖、伤病情况、主客场、比赛时间都是辅助信息。
这篇文章在PMF的基础上,引入了辅助信息,其方法称为DPMF。作者George Dahl是Hinton的学生。源码和数据都可以下载。本文使用篮球比赛举例。

模型

关系矩阵Z

Z Z Z描述队伍间两两比赛的结果: Z m n Z_{mn} Zmn为m,n两队比赛时m队的得分, Z n m Z_{nm} Znm为n队的得分。
x x x表示辅助信息,其维度为 D D D。基础PMF中的关系矩阵 Z Z Z是一个随机变量,这里的 Z ( x ) Z(x) Z(x)变成了关于 x x x随机过程
在一个观测中, Z ( x ) Z(x) Z(x)每个位置上的 x x x值互不相同。

例子
x x x可能包括比赛的地点和时间。主场/客场会影响发挥,相近似的比赛场次会有相近的结果。但即使知道了时间和地点,比赛仍然存在不确定性。某一特定时刻的 Z ( x 0 ) Z(x_0) Z(x0)是一个随机变量。

和基础PMF类似, Z Z Z的每一个元素是一个高斯随机变量
Z m , n ( x ) ∼ N ( Y m , n ( x ) , σ 2 ) = N ( U m ( x m ) V n T ( x n ) , σ 2 ) Z_{m,n}(x) \sim N\left( Y_{m,n}(x), \sigma^2 \right) = N\left( U_m(x_m)V^T_n(x_n), \sigma^2 \right) Zm,n(x)N(Ym,n(x),σ2)=N(Um(xm)VnT(xn),σ2)

U U U的第m行以及 V V V的第n行,对应 Z Z Z中的一个元素mn,故 U U U的每一行的 x x x取值相同,记为 x m x_m xm,同理 V V V的每一行的辅助信息记为 x n x_n xn。例如:只讨论一个辅助信息(时间),则 x m , x n x_m,x_n xm,xn为标量。(后续为简洁起见,有时省略了x的脚标)

其中均值 Y ( x ) Y(x) Y(x)表示系统内部参数,方差 σ \sigma σ。随机过程 U ( x ) , V ( x ) U(x),V(x) U(x),V(x)尺寸为 M × K , N × K M\times K, N\times K M×K,N×K,为低秩的系统内部参数,是要估计的。

为了在同一场比赛的两队得分间引入相关性(己方得分高 → \to 注重进攻 → \to 防守弱 → \to 对方得分高),用二元高斯来描述对称位置的元素。 σ , ρ \sigma, \rho σ,ρ为待估计变量。
[ Z m , n ( x ) Z n , m

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值