nn.BatchNorm中affine参数的作用

chen_znn

已于 2024-05-15 14:47:47 修改

阅读量826

点赞数 5

分类专栏： pytorch 文章标签：人工智能计算机视觉 pytorch 批归一化

于 2024-05-15 14:46:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38964360/article/details/138907537

版权

pytorch 专栏收录该内容

41 篇文章 4 订阅

订阅专栏

在PyTorch的nn.BatchNorm2d中，affine参数决定是否在批归一化（Batch Normalization）过程中引入可学习的缩放和平移参数。

BN层的公式如下，

$\hat{x}=\frac{x-\mu _{batch}}{\sqrt{\sigma _{batch}^{2}+\xi }}$

affine参数决定是否在批归一化之后应用一个可学习的线性变换，即缩放和平移。具体来说，如果 affine=True，批归一化层会有两个额外的可学习参数：缩放参数γ（初始值为1）和平移参数β（初始值为0），归一化后的输出变为，

$y=\gamma \hat{x}+\beta$

若affine=False，则γ和β都为None。相关的源码定义如下，

self.affine = affine
if self.affine:
    self.weight = Parameter(torch.empty(num_features, **factory_kwargs))
    self.bias = Parameter(torch.empty(num_features, **factory_kwargs))
else:
    self.register_parameter("weight", None)
    self.register_parameter("bias", None)

if self.affine:
    init.ones_(self.weight)
    init.zeros_(self.bias)

以下是简单的代码示例，

import torch
import torch.nn as nn


bn_affine = nn.BatchNorm2d(num_features=3, affine=True)
print("bn_affine γ:", bn_affine.weight)
print("bn_affine β:", bn_affine.bias)
"""
bn_affine.weight
Parameter containing:
tensor([1., 1., 1.], requires_grad=True)

bn_affine.bias
Parameter containing:
tensor([0., 0., 0.], requires_grad=True)
"""


bn_no_affine = nn.BatchNorm2d(num_features=3, affine=False)
print("bn_no_affine γ:", bn_affine.weight)
print("bn_no_affine β:", bn_affine.bias)
"""
None
None
"""

关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
nn.BatchNorm中affine参数的作用

本文记录了nn.BatchNorm中的affine参数的作用
复制链接

扫一扫

专栏目录

chen_znn CSDN认证博客专家 CSDN认证企业博客

码龄7年

204: 原创

6245: 周排名

7352: 总排名

46万+: 访问

: 等级

3811: 积分

3944: 粉丝

1629: 获赞

189: 评论

2241: 收藏

私信

关注

热门文章

分类专栏

python 37篇
Linux系统 25篇
opencv 21篇
transformer 2篇
pytorch 41篇
人脸识别 29篇
c++ 30篇
ncnn 7篇
c语言 3篇
激活函数 2篇
vscode 1篇
目标检测 22篇
caffe 4篇
Android 1篇
anaconda 5篇
nvidia 1篇
模型部署 2篇
损失函数 3篇
注意力机制 2篇
大语言模型 1篇
onnxruntime 1篇
人脸重建 1篇
细粒度图像处理 3篇
数据增强 1篇
目标跟踪 2篇

最新评论

机械硬盘和固态硬盘的区别及判断硬盘类型的方法
CSDN-Ada助手: MySQL入门技能树或许可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
Windows系统编译protobuf
chen_znn: 其他版本没试过
Windows系统编译protobuf
v寰宇: 这个版本是有什么说法吗，看了很多其他版本都无法编译成功
Precision和Recall
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
vscode远程ssh连接不稳定的解决方法
Heilyn: 有帮助！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

chen_znn 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。