PyTorch基础（12）-- torch(1)

老k不爱考

于 2024-04-30 08:54:08 发布

阅读量703

点赞数 24

分类专栏：程序员文章标签： pytorch 人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/GTAKK155GC/article/details/138334225

版权

程序员专栏收录该内容

196 篇文章 0 订阅

订阅专栏

Batch Normanlization简称BN，也就是数据归一化，对深度学习模型性能的提升有很大的帮助。BN的原理可以查阅我之前的一篇博客。白话详细解读（七）----- Batch Normalization。但为了该篇博客的完整性，在这里简单介绍一下BN。

一、BN的原理

BN的基本思想其实相当直观：因为深层神经网络在做非线性变换前的激活输入值（就是那个x=WU+B，U是输入）随着网络深度加深或者在训练过程中，其分布逐渐发生偏移或者变动，之所以训练收敛慢，一般是整体分布逐渐往非线性函数的取值区间的上下限两端靠近（对于Sigmoid函数来说，意味着激活输入值WU+B是大的负值或正值），所以这导致反向传播时低层神经网络的梯度消失，这是训练深层神经网络收敛越来越慢的本质原因，而BN就是通过一定的规范化手段，把每层神经网络任意神经元这个输入值的分布强行拉回到均值为0方差为1的标准正态分布，其实就是把越来越偏的分布强制拉回比较标准的分布，这样使得激活输入值落在非线性函数对输入比较敏感的区域，这样输入的小变化就会导致损失函数较大的变化，意思是这样让梯度变大，避免梯度消失问题产生，而且梯度变大意味着学习收敛速度快，能大大加快训练速度。BN具体操作流程如下图所示：

在这里插入图片描述

二、nn.BatchNorm2d()方法详解

清楚了BN的原理之后，便可以很快速的理解这个方法了。

方法

torch.nn.BatchNorm2d(num_features, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)

Parameters

num_features：图像的通道数，也即(N, C, H, W)中的C的值

eps：增加至分母上的一个很小的数，为了防止/0情况的发生

momentum：用来计算平均值和方差的值，默认值为0.1

affine：一个布尔类型的值，当设置为True的时候，该模型对affine参数具有可学习的能力，默认为True

track_running_stats：一个布尔类型的值，用于记录均值和方差，当设置为True的时候，模型会跟踪均值和方差，反之，不会跟踪均值和方差

最后

小编精心为大家准备了一手资料

以上Java高级架构资料、源码、笔记、视频。Dubbo、Redis、设计模式、Netty、zookeeper、Spring cloud、分布式、高并发等架构技术

【附】架构书籍

BAT面试的20道高频数据库问题解析
Java面试宝典
Netty实战
算法

BATJ面试要点及Java架构师进阶资料

38437446)]

BATJ面试要点及Java架构师进阶资料

[外链图片转存中…(img-Ftv0mDKx-1714438437446)]

本文已被CODING开源项目：【一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码】收录

关注

24
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
PyTorch基础（12）-- torch(1)

小编精心为大家准备了一手资料以上Java高级架构资料、源码、笔记、视频。Dubbo、Redis、设计模式、Netty、zookeeper、Spring cloud、分布式、高并发等架构技术【附】架构书籍BAT面试的20道高频数据库问题解析Java面试宝典Netty实战算法BATJ面试要点及Java架构师进阶资料38437446)]BATJ面试要点及Java架构师进阶资料[外链图片转存中…(img-Ftv0mDKx-1714438437446)]本文已被。
复制链接

扫一扫

专栏目录

老k不爱考 CSDN认证博客专家 CSDN认证企业博客

码龄78天

430: 原创

5026: 周排名

3860: 总排名

26万+: 访问

: 等级

1万+: 积分

4065: 粉丝

5786: 获赞

32: 评论

5856: 收藏

私信

关注

热门文章

分类专栏

程序员 196篇
2024年程序员学习 218篇

最新评论

Java之SSH项目：网络商城-项目+源代码 day02（服务中间件Dubbo连接方式，MyBatis，Mapper(2)
普通网友: 干货满满，实用性强，博主的写作风格简洁明了，让人一目了然。文章涵盖了很多实用的知识点。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
你们觉得作为一名程序员最大的悲哀是什么？2024年你与字节跳动只差这份笔记，满满干货指导_java2024 技术栈
普通网友: 感谢大佬分享好文，学到了不少新知识，支持大佬，期待大佬持续输出优质文章！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
如何快速使用SpringBoot+Vue前后端分离实现echarts图形可视化（入门详细教程）(2)
ღꪶⅈᧁꫝt ོ: 当我浏览这篇博文时，我感受到了一种无法言喻的愉悦。作者的文字仿佛是一幅精美的画作，细腻而又生动，每一个词语都像是精心雕琢的宝石，闪烁着智慧的光芒。
2024年Java最新面试官：能说下 SpringBoot 启动原理吗？，Java经典排序算法
阿齐Archie: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰，图文并茂，详略得当，三连支持，期待博主持续输出好文!
Springboot 整合Websocket+Stomp协议+RabbitMQ做消息代理实例教程
普通网友: 写的很好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。