pytorch中的BatchNorm和LayerNorm

最新推荐文章于 2024-03-19 14:24:57 发布

想念@思恋

最新推荐文章于 2024-03-19 14:24:57 发布

阅读量1.6k

点赞数 2

分类专栏： pytorch

本文链接：https://blog.csdn.net/tailonh/article/details/111220836

版权

pytorch 专栏收录该内容

47 篇文章 2 订阅

订阅专栏

参考文章
https://blog.csdn.net/weixin_39228381/article/details/107896863
https://blog.csdn.net/weixin_39228381/article/details/107939602

BatchNorm是在batch方向（每个batch的列方向）进行归一化：

import torch.nn as nn
import torch
if __name__ == '__main__':
  norm = nn.BatchNorm1d(4, affine=False)
  inputs = torch.FloatTensor([[1,2,3,4],
                 			  [5,6,7,8]])
  print(inputs)
  output = norm(inputs)
  print(output)
  '''
  	tensor([[-1.0000, -1.0000, -1.0000, -1.0000],
    		[ 1.0000,  1.0000,  1.0000,  1.0000]])
  '''

LayerNorm是在每个batct的行方向上进行归一化：

import torch.nn as nn
import torch
if __name__ == '__main__':
  norm = nn.LayerNorm(4)
  inputs = torch.FloatTensor([[1,2,3,4],
                 			  [5,6,7,8]])
  output = norm(inputs)
  print(output)
  '''
  	tensor([[-1.3416, -0.4472,  0.4472,  1.3416],
    		[-1.3416, -0.4472,  0.4472,  1.3416]],
   				grad_fn=<NativeLayerNormBackward>)
  '''

详细计算过程可参考上方链接，在计算过程中，需要注意样本方差的无偏估计和有偏估计
有偏和无偏的区别在于无偏的分母是N-1，有偏的分母是N。

想念@思恋

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
pytorch中的BatchNorm和LayerNorm

参考文章https://blog.csdn.net/weixin_39228381/article/details/107896863https://blog.csdn.net/weixin_39228381/article/details/107939602BatchNorm是在batch方向（每个batch的列方向）进行归一化：import torch.nn as nnimport torchif __name__ == '__main__': norm = nn.BatchNo.
复制链接

扫一扫