玻尔兹曼从玻尔兹曼分布到推荐算法

最新推荐文章于 2024-07-18 07:55:58 发布

Aogon

最新推荐文章于 2024-07-18 07:55:58 发布

阅读量2.4k

点赞数

神经网络的两大基本功能是：特征变换和分类（回归）预测。每个基本的神经网络模型至少具备两者功能之一。而RBM则是用于进行特征变换的。考虑输入特征为以及转化的特征为（注: 这里是的另一种表示，而不是预测结果，这里不考虑预测的问题）,RBM的任务是找到 $X\Rightarrow Y$ 的映射关系。基本的神经网络模型，通常用决策函数 Y=f(X) 表示这种映射关系，而对于RBM来说，则用联合概率分布表示这种映射关系。无论是判别函数还是联合概率分布，都是可以描述变量关系的，且在任意条件下二者可以互相转化。因此，RBM从概率的角度去描述变量之间的关系，提供了另外一种解决特征提取问题的思路。

来源：https://zhuanlan.zhihu.com/p/24989699

玻尔兹曼分布是基于最大信息熵原理的，而当一个随机变量的平均值给定时，还可以有多种概率分布与之相容。现在的问题是如何从这些相容的概率分布中挑选出“最可几”的分布来作为实际上的分布。显然，要做到这点，必须有个挑选标准，最大信息熵原理就可作为这种挑选标准。

信息熵最大值的概率分布为：

Maxwell–Boltzmann statistics条件下的信息熵最大值的概率分布为：

来源：https://blog.csdn.net/antkillerfarm/article/details/71402953

RBM模型的损失函数与优化

RBM模型的关键就是求出我们模型中的参数W,a,bW,a,b。如果求出呢？对于训练集的m个样本，RBM一般采用对数损失函数，即期望最小化下式：

来源：https://www.cnblogs.com/pinard/p/6530523.html

受限玻尔兹曼机在协同过滤的应用。

将该模型应用到协同过滤需要解决以下两个问题:

鉴于RBM中的单元都是二元变量, 如果用这些二元变量来对整数值的评分建模?
用户的打分是非常稀疏的, 亦即用户只会对很少的物品(比如电影)打分, 如何处理这些缺失的评分?

2. 基于RBM的协同过滤

R. R. Salakhutdinov等人提出了一种使用RBM来进行协同过滤的方法:

假设有m个电影, 则使用m个softmax单元来作为可见单元来构造RBM. 对于每个用户使用不同的RBM, 这些不同的RBM仅仅是可见单元不同, 因为不同的用户会对不同的电影打分, 所有的这些RBM的可见单元共用相同的偏置以及和隐藏单元的连接权重W. 该方法很好的解决了之前提到的问题:

使用softmax来对用户的评分进行建模, softmax是一种组合可见单元, 包含k个二元单元, 第i个二元单元当且只当用户对该电影打分为i时才会置为1.
如果一个用户没有对第j个电影评分, 则该用户的RBM中不存在第j个softmax单元.

来源：http://www.cnblogs.com/kemaswill/p/3269138.html

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Aogon CSDN认证博客专家 CSDN认证企业博客

码龄9年

2: 原创

69万+: 周排名

192万+: 总排名

1万+: 访问

: 等级

159: 积分

0: 粉丝

2: 获赞

1: 评论

7: 收藏

私信

关注

最新评论

PDFMiner python3中文字体库问题，WARNING:root:UniGB-UCS2-H
小菜鸭蛋: 这是要把这正一段代码复制到cmd上面的意思吗，我觉得CMD识别不了这是什么啊，我是小白刚刚学python我不太明白，

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。