【推荐系统算法】BPMF(Bayesian Probabilistic Matrix Factorization)

最新推荐文章于 2023-05-28 16:18:25 发布

shenxiaolu1984

最新推荐文章于 2023-05-28 16:18:25 发布

阅读量1.1w

点赞数 7

分类专栏：论文解读文章标签：算法机器学习推荐系统贝叶斯

本文链接：https://blog.csdn.net/shenxiaolu1984/article/details/50405659

版权

本文介绍了BPMF（Bayesian Probabilistic Matrix Factorization）模型，它是对PMF模型的扩展，采用贝叶斯方法处理推荐系统的数据。通过Markov Chain Monte Carlo (MCMC)方法进行参数更新和预测，从而减少过拟合，提高预测精度。在实验中，BPMF相对于基础PMF模型显示出更好的性能。

摘要由CSDN通过智能技术生成

Salakhutdinov, Ruslan, and A. Mnih. “Bayesian probabilistic matrix factorization using markov chain monte carlo.” International Conference on Machine Learning 2008:880-887.

对PMF模型以及应用场景不熟悉的同学可以先阅读这篇基础PMF。
本论文的模型和前文类似，但在求解时，是从贝叶斯角度而不是传统概率角度出发：不再把系统参数当做一个固定值估计，而是作为一个服从某种分布的随机变量，转而估计该分布的参数。

问：明天什么天气？传统观点估计：呃，晴天吧。贝叶斯观点估计：60%晴天，40%下雨。传统观点估计：你个心机婊。

模型

用 $N\times M$ 关系矩阵 $R$ 来描述 $N$ 个用户给 $M$ 部电影的打分。这里 $R$ 为观测值。
$\sim N(R|U^TV, \alpha^{-1}) = \prod_{ij}N(R_{ij}|U^T_iV_j,\alpha^{-1})$

矩阵高斯函数等于其元素高斯函数的乘积。其中标量 $\alpha$ 为精度，等价于协方差的倒数（这样写是为了后续计算方便）。
$R$ 的各个位置（即各次观测）的精度相同。

$U, V$ 尺寸为 $N\times D, M\times D$ ，也服从高斯分布。（在基础PMF中，U,V都是待求的固定值）
$\sim N(U|\mu_U, \Lambda_U^{-1}) = \prod_i N(U_i|\mu_U,\Lambda_U^{-1})$

$\sim N(V|\mu_V, \Lambda_V^{-1}) = \prod_j N(V_j|\mu_V,\Lambda_V^{-1})$

所有用户共享一组超参数 $\mu_U,\Lambda_U$ ，尺寸为 $D\times1, D\times D$ 。所有电影同样共享一组超参数 $\mu_V,\Lambda_V$ 。
超参数 $\mu,\Lambda$ 服从Gaussian-Wishart分布，表示为一个均值的高斯分布，以及一个协方差的威沙特分布的乘积。
$p\left(\mu,\Lambda \right)\sim N(\mu|\mu_0,(\beta_0\Lambda)^{-1}) \cdot W(\Lambda|W_0,\nu_0)$