2021-08-24

qq_40285553

于 2021-08-24 10:26:36 发布

阅读量338

点赞数

文章标签： pytorch 深度学习神经网络

本文链接：https://blog.csdn.net/qq_40285553/article/details/119883842

版权

self.embedding.weight.requires=False即可不进行训练
加载预训练权重：self.embedding.weight.data.copy_(tensor)
如果要对输入进行求导，需再输入上加一个input=Variable(input,requires_grad)，然后可以通过input.requires_grad查看是否有梯度
model里有一个linear1，可以通过model.linear1.weight查看linear1参数，RNN_stock.linear_layer.weight.data.copy_(RNN_stock.linear_layer.weight-RNN_stock.linear_layer.weight.grad)可以更新参数，train_x_batch.grad.data查看梯度，train_x_batch=train_x_batch-train_x_batch.grad对输入进行更新。

tensor在GPU里，tensor.detach().cpu().numpy()即可转移到CPU中
保存模型
torch.save(reason_model.state_dict(), ‘./best_model/’ + ‘word_by_word_attention_best.pkl’)
reason_model.load_state_dict(torch.load(’./best_model/best.pkl’))

train_data_train = TensorDataset(data_pre_train, data_hyp_train, data_label_train)
train_sampler_train = RandomSampler(train_data_train)
train_loader_train = DataLoader(dataset=train_data_train,
batch_size=args.batch_size,
sampler=train_sampler_train)
初始化权重
def weights_init(m):
classname=m.class.name
if classname.find(‘Linear’)!=-1:
nn.init.uniform_(m.weight,-0.5,0.5)
nn.init.constant_(m.bias,0.0)
reason_model.apply(weights_init)

word2vec=models.keyedvectors.load_word2vec_format(data_dir,binary=True)
word2vec_load[(da1 for da1 in [‘man’,‘eat’,‘srfhdgdhgsg’])]

params=filter(lambda p:p.requires_grad,cnn_model.parameters())

qq_40285553

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
2021-08-24

self.embedding.weight.requires=False即可不进行训练加载预训练权重：self.embedding.weight.data.copy_(tensor)如果要对输入进行求导，需再输入上加一个input=Variable(input,requires_grad)，然后可以通过input.requires_grad查看是否有梯度model里有一个linear1，可以通过model.linear1.weight查看linear1参数，RNN_stock.linear_layer
复制链接

扫一扫

2021-08-24

“相关推荐”对你有帮助么？