pytorch下rnn的一些思考

最新推荐文章于 2024-04-07 09:12:00 发布

nio006

最新推荐文章于 2024-04-07 09:12:00 发布

阅读量141

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/weixin_43890188/article/details/105084843

版权

深度学习专栏收录该内容

15 篇文章 0 订阅

订阅专栏

import torch

x = torch.ones(1,1,1)
b0 = torch.zeros(2,1,1)
# out: 3,1,5
rnn = torch.nn.RNN(1,1,num_layers=2,batch_first=False)
wb4 = list(rnn.parameters())

o,h =rnn(x,b0)
# print(o.shape,h.shape)
print(o)
print(h)
print('++++++')

whx = wb4[0]
print('wb4',wb4)
print('++++++')
bw = wb4[2]
whh = wb4[1]
bh = wb4[3]
rst1 = x@whx.t()
print(rst1)
rst2 = bw
print(rst2)
rst3 = b0@whh.t()
print(rst3)
rst4 = bh
print(rst4)
print('+++++++')
print(torch.tanh(rst1+rst2+rst3+rst4))

以上代码说名一个问题，对于双层rnn,求出的ht的shape=（num_layers,batchsize,hiddendim）,也就是说包含两个输出的隐藏。ht[0]是下面的那一个，ht[1]是上面的。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

nio006

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pytorch下rnn的一些思考

import torchx = torch.ones(1,1,1)b0 = torch.zeros(2,1,1)# out: 3,1,5rnn = torch.nn.RNN(1,1,num_layers=2,batch_first=False)wb4 = list(rnn.parameters())o,h =rnn(x,b0)# print(o.shape,h.shape)pr...
复制链接

扫一扫