RBM的理解

RBM 是基于能量函数的无向图模型。将图节点分为可见层节点v和隐藏层节点h,其联合概率分布p(h,v)可表示为p(h,v)= \frac{e^{-E(h,v)}}{z}

其中,能量函数E(h,v)= -(h^{T}\omega v+\alpha^{T} v+\beta ^{T}h)

利用RBM计算p(h|v)的概率,即在可见层已知时,计算隐藏层h的概率。要根据v推断h,可求argmax p(h|v)。先得通过训练样本来估计模型参数\theta(\omega ,\alpha ,\beta )

采用极大似然估计,由于训练数据只有可见节点,对数似然函数为:

\frac{1}{N}\sum logp(v^{i}) N是样本数。

求p(v)可以由p(h,v)的边缘概率来计算:

p(v)= \sum_{h}p(h,v)

对数似然梯度:

\frac{\partial\frac{1}{N}\sum logp(v^{i})}{\partial \theta },其中,根据能量函数模型有:

logp(v)=log\sum_{h}p(h,v)=log\sum_{h}\frac{1}{z}e^{-E(h,v)}

=log\sum_{h}e^{-E(h,v)}-log\sum_{h,v}e^{-E(h,v)}

故梯度的偏导数:

\frac{\partial\ logp(v)}{\partial \theta } = \partial log\sum_{h}e^{-E(h,v)}/\partial \theta -\partial log\sum_{h,v}e^{-E(h,v)}/\partial \theta

=-\sum _{h}p(h|v)\partial E(h,v)/\partial \theta+\sum _{h,v}p(h,v)\partial E(h,v)/\partial \theta

\omega求偏导:

\partial log p(v)/\partial \omega _{ij}=-\sum _{h}p(h|v)\partial E(h,v)/\partial \omega_{ij} +\sum _{h,v}p(h,v)\partial E(h,v)/\partial \omega_{ij}

=-\sum _{h}p(h|v)(-h_{i}v_{j})+\sum _{h,v}p(h,v)(-h_{i}v_{j})

=-\sum _{h_{i}}\sum _{h_{-i}}p(h_{i},h_{-i}|v)(-h_{i}v_{j})+\sum _{v}p(v)\sum _{h_{i},h_{-i}}p(h_{i},h_{-i}|v)(-h_{i}v_{j})

=p(h_{i}=1|v)v_{j}-\sum _{v}p(v)p(h_{i}=1|v)v_{j}

前一项的v是样本的点,后一项的v是所有v的值。

前一项可以直接计算,后一项对所有v求均值(期望),是np问题,通过mcmc对p(v)采样近似计算。

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值