RNN参数详解+实例分析

最新推荐文章于 2024-06-16 18:20:04 发布

缦旋律

最新推荐文章于 2024-06-16 18:20:04 发布

阅读量4.1k

点赞数 9

分类专栏： pytorch

小陈一行一行地敲出来的啦~

本文链接：https://blog.csdn.net/weixin_41391619/article/details/105254289

版权

import torch
from torch import nn
import numpy as np
from torch import optim

rnn = nn.RNN(input_size=100,hidden_size=10,num_layers=2) #初始化一个RNN网络
# input_size 是一个单词或者汉字的size，比如你embedding的时候，一个单词用一个100维的向量来表示，那么你这里的input_size就是100
# hidden_size就是h的size
# num_layers就是RNN的层数，深层RNN的话，num_layers设置大一点就可以
'''
其实我觉得，可以把input_size看为原始特征个数，hidden_size就是特征提取之后的特征个数（CNN中就是feature_maps的数量）
与CNN或者一般FNN不同的是，CNN每层的feature_maps的数量可以改变，比如我最开始输入的特征数量是28*28=784
通过设置第一层的feature_maps的数量为100，我把特征个数改变到了100；再通过设置第二层的feature_maps的数量为50，我又可以把特征个数变成50...
FNN中，我设置第一层的参数矩阵的size是784*100，就把特征个数变成100；再设置第二层的参数矩阵的size是100*50，就把特征个数变成了50
但是在多层RNN中，每一层的特征个数是不变的，比如这里我原始的特征个数是100，通过第一层RNN后，我特征个数变成了10，
但是后面不管如何增加RNN的层数，我的特征个数永远都是10了，因为我的hidden_size已经固定在10了。
也就是说，除了第一层的weight_ih的size是原始特征个数*hidden_size以外，
其他层的weight_ih size都是hidden_size*hidden_size（这里没有考虑batch_size）

'''

rnn._parameters.keys()
'''
（以下关于size的讨论都没有考虑batch_size）
weight_ih代表与x相乘的参数矩阵 l0表示layer0，即第一层；在这个网络中，weight_ih_l0的size是10*100
weight_hh表示与h相乘的参数矩阵，likewise，l0表示第一层；在这个网络中，weight_hh_l0的size是10*10
bias_hh_l0表示第一层的bias，size是10
weight_ih_l1的size是10*10
weight_hh_l1的size是10*10
bias_hh_l1的size是10
'''

odict_keys(['weight_ih_l0', 'weight_hh_l0', 'bias_ih_l0', 'bias_hh_l0', 'weight_ih_l1', 'weight_hh_l1', 'bias_ih_l1', 'bias_hh_l1'])

x = torch.randn([10,3,100]) 
# 随便设一个x 可以看成每句话有10个单词，每个单词用一个100维向量表示，一共有3句话 
# 即size为[seq_len,bacth_size,embedding_size]
# 在初始化RNN时，有一个参数为batch_first，默认值为False,如果设置为True，那么input的size就应该为[batch_size,seq_len,embedding_size]
h0 = torch.zeros([2,3,10]) 
'''
初始化h0，这里我们全部初始化为0，如果不给h0的话，RNN也会随机初始化。
2表示有两层RNN，每层RNN都要有h0
3表示有3句话，或者说batch_size是3;每个句子都要有一个h0矩阵
10是hidden_size是10
'''

out,h = rnn(x,h0) #RNN输出的h是最后一个时刻的h

out.size

最低0.47元/天解锁文章

缦旋律

关注

9
点赞
踩
32

收藏

觉得还不错? 一键收藏
0
评论
RNN参数详解+实例分析

import torchfrom torch import nnimport numpy as npfrom torch import optimrnn = nn.RNN(input_size=100,hidden_size=10,num_layers=2) #初始化一个RNN网络# input_size 是一个单词或者汉字的size，比如你embedding的时候，一个单词用一个10...
复制链接

扫一扫