学习笔记9:受限玻尔兹曼机(RBM)

本文介绍了受限玻尔兹曼机(RBM)的基础知识,包括其模型结构、概率分布、损失函数和优化方法。RBM是一种两层神经网络,常用于推荐系统等应用。通过编码解码过程,RBM能从可见层到隐藏层进行特征学习,并通过反向解码预测评分,实现推荐。学习RBM有助于理解深度学习中的玻尔兹曼机和深度玻尔兹曼机。
摘要由CSDN通过智能技术生成

1.RBM模型

玻尔兹曼机是一大类的神经网络模型,但是在实际应用中使用最多的则是RBM。RBM本身模型很简单,只是一个两层的神经网络,因此严格意义上不能算深度学习的范畴。不过深度玻尔兹曼机(Deep Boltzmann Machine,以下简称DBM)可以看做是RBM的推广。理解了RBM再去研究DBM就不难了,因此本文主要关注于RBM。

回到RBM的结构,它是一个个两层的神经网络,如下图所示:
这里写图片描述
这里写图片描述

2.RBM概率分布

对于给定的状态向量h和v,则RBM当前的能量函数可以表示为:

E(v,h)=aTvbThhTWv E ( v , h ) = − a T v − b T h − h T W v

有了能量函数,则我们可以定义RBM的状态为给定v,h的概率分布为:

P(v,h)=1ZeE(v,h) P ( v , h ) = 1 Z e − E ( v , h )

其中Z为归一化因子,类似于softmax中的归一化因子,表达式为:

Z=v,heE(v,h) Z = ∑ v , h e − E ( v , h )

有了概率分布,我们现在来看条件分布P(h|v):

P(h|v)=P(h,v)P(v)=1P

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值