torch中的LayerNorm参数解释以及自定义

参数:

 参数normalized_shape代表需要标准化的维度,比如输入的tensor维度为(2, 2, 3),那么如果normalized_shape输入为3,则对最后一维进行标准化,如果输入为[2, 3],则对最后两维进行标准化。

公式里的ε 。

确定需不需要标准化后进行仿射变换,也就是乘上γ和β 

torch中的layernorm使用:

import torch
import torch.nn

hidden_size = 3
layer_norm_eps = 1e-5
#带参数
layernorm = nn.LayerNorm(hidden_size, eps=layer_norm_eps)
#不带参数
layernorm2 = nn.LayerNorm(hidden_size, eps=layer_norm_eps, elementwise_affine=False)

#shape=(2, 2, 3)
hidden_states = torch.tensor([[[1, 2, 3],[2, 3, 1]],[[3, 1, 2],[4, 2, 5]]]

hidden_states = layernorm(hidden_states)

 

如果需要自定义γ和β:

#gamma和beta与输入形状相同
gamma = torch.ones_like(hidden_states)
beta = torch.ones_like(hidden_states)
hidden_states = gamma*hidden_states+beta

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值