RBM的理解

最新推荐文章于 2022-07-04 07:30:00 发布

bytes9

最新推荐文章于 2022-07-04 07:30:00 发布

阅读量1.7k

点赞数

分类专栏：算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bytes9/article/details/112220199

版权

机器学习同时被 2 个专栏收录

10 篇文章 0 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

RBM 是基于能量函数的无向图模型。将图节点分为可见层节点v和隐藏层节点h，其联合概率分布p(h,v)可表示为 $p(h,v)= \frac{e^{-E(h,v)}}{z}$

其中，能量函数 $E(h,v)= -(h^{T}\omega v+\alpha^{T} v+\beta ^{T}h)$ 。

利用RBM计算p(h|v)的概率，即在可见层已知时，计算隐藏层h的概率。要根据v推断h,可求argmax p(h|v)。先得通过训练样本来估计模型参数 $\theta(\omega ,\alpha ,\beta )$ 。

采用极大似然估计,由于训练数据只有可见节点，对数似然函数为：

$\frac{1}{N}\sum logp(v^{i})$ N是样本数。

求p(v)可以由p(h,v)的边缘概率来计算:

$p(v)= \sum_{h}p(h,v)$

对数似然梯度：

$\frac{\partial\frac{1}{N}\sum logp(v^{i})}{\partial \theta }$ ,其中，根据能量函数模型有：

$logp(v)=log\sum_{h}p(h,v)=log\sum_{h}\frac{1}{z}e^{-E(h,v)}$

$=log\sum_{h}e^{-E(h,v)}-log\sum_{h,v}e^{-E(h,v)}$

故梯度的偏导数：

$\frac{\partial\ logp(v)}{\partial \theta } = \partial log\sum_{h}e^{-E(h,v)}/\partial \theta -\partial log\sum_{h,v}e^{-E(h,v)}/\partial \theta$

$=-\sum _{h}p(h|v)\partial E(h,v)/\partial \theta+\sum _{h,v}p(h,v)\partial E(h,v)/\partial \theta$

对 $\omega$ 求偏导：

$\partial log p(v)/\partial \omega _{ij}=-\sum _{h}p(h|v)\partial E(h,v)/\partial \omega_{ij} +\sum _{h,v}p(h,v)\partial E(h,v)/\partial \omega_{ij}$

$=-\sum _{h}p(h|v)(-h_{i}v_{j})+\sum _{h,v}p(h,v)(-h_{i}v_{j})$

$=-\sum _{h_{i}}\sum _{h_{-i}}p(h_{i},h_{-i}|v)(-h_{i}v_{j})+\sum _{v}p(v)\sum _{h_{i},h_{-i}}p(h_{i},h_{-i}|v)(-h_{i}v_{j})$

$=p(h_{i}=1|v)v_{j}-\sum _{v}p(v)p(h_{i}=1|v)v_{j}$

前一项的v是样本的点，后一项的v是所有v的值。

前一项可以直接计算，后一项对所有v求均值（期望），是np问题，通过mcmc对p(v)采样近似计算。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
RBM的理解

RBM 是基于能量函数的无向图模型。将图节点分为可见层节点v和隐藏层节点h，其联合概率分布p(h,v)可表示为其中，能量函数。利用RBM计算p(h|v)的概率，即在可见层已知时，计算隐藏层h的概率。要根据v推断h,可求argmax p(h|v)。先得通过训练样本来估计模型参数。采用极大似然估计，梯度上升算法。由于训练数据只有可见节点，对数似然函数为：N是样本数。...
复制链接

扫一扫

专栏目录

bytes9 CSDN认证博客专家 CSDN认证企业博客

码龄16年

45: 原创

11万+: 周排名

4万+: 总排名

3万+: 访问

: 等级

651: 积分

6: 粉丝

18: 获赞

5: 评论

49: 收藏

私信

关注

热门文章

分类专栏

css 2篇
spring 8篇
javascript 1篇
前端 1篇
Java
版本控制工具 1篇
算法 3篇
opencv
python 9篇
机器学习 10篇
tensorflow 6篇

最新评论

gibbs采样算法的理解
不正经的kimol君: 写的不错，学习了，学习的道路上一起进步，也期待你的关注与支持！
tensorflow为何采用图（Graph）方式之我的理解
bytes9: tensorflow官网有
tensorflow为何采用图（Graph）方式之我的理解
qq_41723498: 动态图出处能给个引用吗
python 笔记
bytes9: 使用单下划线(_one_underline)开头表示方法不是API的一部分，不要直接访问（虽然语法上访问也没有什么问题）。使用双下划线开头(__two_underlines)开头表示子类不能覆写该方法。除非你真的知道你在干什么，否则不要使用这种方式。当你想让自己定义的对象也可以像Python内置的对象一样使用Python内置的一些函数或操作符（比如len、add、+、-、==等）时，你可以定义该类方法。当然还有些属性只在末尾加了但下划线，这仅仅是为了避免我们起的一些名字和Python保留关键字冲突，没有特殊含义。
python 笔记
bytes9: 单下划线开头我们经常看到方法或者属性前面加了单下划线，并认为它表示该方法或者属性是该类型（Python和Golang一样，不光类可以有方法，很多类型甚至基本类型也可以定义方法）的私有方法或属性。但其实在Python中不存在真正意义上的私有方法或者属性，前面加单下划线_只是表示你不应该去访问这个方法或者属性，因为它不是API的一部分。双下划线开头之前很多人跟我说Python中双下划线开头表示私有，我在很多地方也见到这样的说法。这样理解可能也不能说错，但这不是Python设计双下划线开头的初衷和目的，Python设计此的真正目的仅仅是为了避免子类覆盖父类的方法。开头结尾双下划线一般来说像__this__这种开头结尾都加双下划线的方法表示这是Python自己调用的，你不要调用。比如我们可以调用len()函数来求长度，其实它后台是调用了__len__()方法。一般我们应该使用len，而不是直接使用__len__(): 我们一般称__len__()这种方法为magic methods，一些操作符后台调用的也是也是这些magic methods

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。