LSTM调参感悟

最新推荐文章于 2024-05-28 23:07:49 发布

xuzhaoqingbuaa

最新推荐文章于 2024-05-28 23:07:49 发布

阅读量9.2k

点赞数 4

分类专栏：深度学习自然语言处理文章标签：深度学习

本文链接：https://blog.csdn.net/xuzhaoqingbuaa/article/details/80670199

版权

自然语言处理同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

深度学习

0 篇文章 0 订阅

订阅专栏

1. 一定要对数据进行归一化的预处理

train -= np.mean(train, axis = 0) # zero-center
train /= np.std(train, axis = 0) # normalize
test -= np.mean(test,axis=0)
test /= np.std(test,axis=0)

2. 要用正交化初始化lstm 的weight值，如果可能的话，也可以将gate的bias设为0

def init_weight(self):  
        for name, param in self.lstm.named_parameters():
              if 'bias' in name:
                     nn.init.constant(param, 0.0)
                     print('\nbias init done')
              elif 'weight' in name:
                     nn.init.orthogonal(param)  
                     print('\nweight init done')

3. 可以在定义的时候加入dropout，一般设为0.5

4. batch_size不要设太大，我设的8感觉就不错（当然也有人说要大些，见仁见智）

5.learning_rate一般取0.001

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

xuzhaoqingbuaa

关注关注

4
点赞
踩
27

收藏

觉得还不错? 一键收藏
3
评论
LSTM调参感悟

1. 一定要对数据进行归一化的预处理train -= np.mean(train, axis = 0) # zero-centertrain /= np.std(train, axis = 0) # normalizetest -= np.mean(test,axis=0)test /= np.std(test,axis=0)2. 要用正交化初始化lstm 的weight值，如果可能的话，也...
复制链接

扫一扫