最近阅读了一篇老文章—Bayesian non-negative matrix factorization,是个论文集,本文在540-547页,这篇文章用贝叶斯方法重做了一遍非负矩阵分解,但其推导过程过于简略,本人将记录一下其核心推导过程,也就是原文公式(5)和公式(7)的推导过程。
定义,其中,,,关于的似然函数为:
而变量和的先验为:
和
另外,再定义噪声方差的先验:
关于和的条件后验密度是一个高斯分布乘以一个截断的指数分布,也就是一个截断的高斯分布,我们定义这种形式为,因此,关于的条件概率密度为:
(1)
为了方便表示,我们先考虑上式的指数部分:
(2)
其中:
(3)
将(3)回代入(2):
推导进行到这一步后,会发现根本凑不出来完全平方项,但通过观察第二项,发现除了,与无关,而且上式中,除了前两项,第三项也与无关,因此,我们可以根据前两项配出完全平方项,而多余的部分由于在指数上最后就会变成一个比例常数项,因此,上式可以改写为:
(4)
将公式(4)回代如公式(1):
因此,中:
关于噪声方差:
因此,噪声方差所服从的逆伽马分布的参数更新公式分别为:
(感觉此处原文有误,原文多加了个1),