基于python的RBM实现

最新推荐文章于 2024-08-19 10:02:57 发布

冷漠的支持向量机

最新推荐文章于 2024-08-19 10:02:57 发布

阅读量1.9k

点赞数 1

分类专栏： python编程

本文链接：https://blog.csdn.net/weixin_44796784/article/details/105719608

版权

python编程专栏收录该内容

4 篇文章

订阅专栏

本文介绍了一个基于PyTorch实现的限制玻尔兹曼机(RBM)模型，详细展示了模型的训练过程，包括两种不同的训练方法：基于迭代次数的训练和基于可视层均方误差的训练。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

主要用的是pytorch来写的，numpy也行，把对应的地方一换应该也是可以的

"""
this code is for RBM based on CD-1 learning
author:media
date:2020-4-23
"""
import torch
import torch.utils.data as Data
import pandas as pd
import numpy as np

class MyDataset(torch.utils.data.Dataset):
    def __init__(self, data_root):
        self.data = data_root

    def __getitem__(self, index):
        data = self.data[index]
        return data

    def __len__(self):
        return len(self.data)


def own_loader(x):
    x_tensor = torch.FloatTensor(x)
    return x_tensor


def read_data(file_path):
    data = pd.read_csv(file_path)
    train_data = np.array(data)  # np.ndarray()
    train_x_list = train_data.tolist()  # list
    return train_x_list

data = read_data('*.csv')
traindataset = MyDataset(data)
leng = len(data)
batch_size = 64
tra, var = torch.utils.data.random_split(traindataset, lengths=[int(0.8 * leng), leng-int(0.8*leng)])
train_loader = Data.DataLoader(dataset=tra, batch_size=batch_size, shuffle=True, drop_last=False)

class RBM:

    def __init__(self, _vis_dim, _hid_dim):
        self.vis_dim = _vis_dim
        self.hid_dim = _hid_dim
        self.lr = 0.01
        self.bis_v = torch.zeros(_vis_dim)
        self.bis_h = torch.zeros(_hid_dim)
        self.weight = torch.rand(_vis_dim, _hid_dim)

    def train(self, x):
        """ this part is for cd-1 sampling"""
        h_temp = torch.sigmoid(self.bis_h + x.mm(self.weight))  # visible -> hidden
        h = torch.sign(h_temp-torch.randint(0, 2, (1, self.hid_dim)))  # binary process
        v_temp = torch.sigmoid(self.bis_v + h.mm(self.weight.t()))  # hidden -> new_visible
        v_out = torch.sign(v_temp-torch.randint(0, 2, (1, self.vis_dim)))  # binary process
        """ this part is for updating the connection weights"""
        h_out = torch.sigmoid(self.bis_h + v_out.mm(self.weight))  # new_visible -> new_hidden
        self.weight = self.weight + self.lr * ((x-v_out).t().mm(h_temp))
        tt = torch.mean(h_temp-h_out, dim=0)
        self.bis_h = self.bis_h + self.lr * torch.mean(h_temp-h_out, dim=0)
        self.bis_v = self.bis_v + self.lr * torch.mean(x - v_out, dim=0)

    def predict(self, x):
        h_temp = torch.sigmoid(self.bis_h + x.mm(self.weight))  # visible -> hidden
        h = torch.sign(h_temp - torch.randint(0, 2, (1, self.hid_dim)))  # binary process
        v_temp = torch.sigmoid(self.bis_v + h.mm(self.weight.t()))  # hidden -> new_visible
        v_out = torch.sign(v_temp - torch.randint(0, 2, (1, self.vis_dim)))  # binary process
        return v_out


def train_method_1(n_epoch):
    for i in range(n_epoch):
        for (data, _) in enumerate(trainloader):
            rbm.train(data)


def train_method_2(door):
    square_error = 1000
    while square_error > door:
        batch_num = 0
        whole_error = 0
        for (data, _) in enumerate(trainloader):
            rbm.train(data)
            v_out = rbm.predict(data)
            whole_error += torch.nn.MSELoss(data, v_out)
            batch_num += 1
        square_error = whole_error/batch_num

在下面又写了两个训练方法，第一个是针对设定迭代阈值作为终止条件，第二个是使用可视层的均方误差作为终止条件，因为这两个是我临时起意加上去的，所有准确性可能有待商榷，尤其是第二个计算均方差那里，懒得去实现直接调用了nn的计算均方误差的库（我觉得大概率是过不了的）。
因为小弟我还是初学者，希望抛砖引玉让各位大佬指正我的问题，谢谢！