本文来源于BPMF Imputation - transdim,主要讨论如何利用 贝叶斯概率矩阵分解 (Bayesian Probabilistic Matrix Factorization, BPMF) 估计矩阵中的缺失元素,其中,贝叶斯概率矩阵分解是以 高斯分布为基本假设,并采用 Gibbs采样做参数估计。另外,感兴趣的读者可在transdim - GitHub项目中下载数据集和Jupyter notebook。
准备阶段
在进行贝叶斯概率矩阵分解之前,需要调用一些常用的package,如numpy等。以scipy.stats中的Wishart分布和numpy.random中的多元正态分布为基础,设计贝叶斯概率矩阵分解采样过程中会遇到的Gaussian-Wishart分布。
![003bacef370cb65a40abe15128c6067b.png](https://img-blog.csdnimg.cn/img_convert/003bacef370cb65a40abe15128c6067b.png)
另外,在矩阵分解过程中,为了加快采样过程的计算效率,需要用到一种特殊的矩阵运算规则 - Khatri-Rao积,即
![05efa04ed532c0039de84591a5025590.png](https://img-blog.csdnimg.cn/img_convert/05efa04ed532c0039de84591a5025590.png)