类似一个autoencoder,但是压缩的结果是不定的,每个节点符合伯努利分布
首先,根据能量函数,能量越大,出现的概率越低,给出的是显层和隐层的联合概率分布,据此可以得出,显层和隐层的条件概率分布
如何训练:
先根据显层预测隐层
再根据隐层预测显层
w = w + r*(两次显层的差值)
推荐系统的应用
假设一个人有N个物品有评分,M个物品无评分,就将这个人的N个物品评分放入受限玻尔兹曼机中进行训练,M个无评分物品对应的权重w不用更新,
放入下一个人的评分,依次循环
经过若干轮循环,w收敛稳定,网络训练结束
最后:放入一个人的M个物品评分,就能反推出他的那N个没有打分的物品的可能打分