EvoNorms

最新推荐文章于 2024-08-14 05:51:03 发布

AI算法网奇

最新推荐文章于 2024-08-14 05:51:03 发布

阅读量2.6k

点赞数

分类专栏：深度学习宝典

本文链接：https://blog.csdn.net/jacke121/article/details/105925923

版权

深度学习宝典专栏收录该内容

1028 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

本文探讨了正则化层和激活层的协同设计，通过将它们视为单一构建模块进行研究。通过在超大batch规格下训练并可视化学习过程，EvoNorm-B0显示出了优于BN-RELU和ResNet-50的泛化性能，同时在优化和泛化性能上都有所提升。提供了相关代码链接。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

evolving normalization activation layers

本篇文章则通过将正则化层和激活层公式化为一个单独的构建模块，来研究他们的协同设计

同时，本文还进行了具有超大batch规格的学习动态过程的可视化。在训练设置相同的情况下，相比BN-RELU和ResNet-50，虽然训练损失较大，但是，EvoNorm-B0展现了更好的泛化性能。在其他所有的情况下，EvoNorm同时实现了优化性能和泛化性能的提升。

代码：

https://github.com/lonePatient/EvoNorms_PyTorch/blob/master/models/normalization.py

import torch
import torch.nn as nn
from torch.nn import init
from torch.nn.parameter import Parameter

def instance_std(x, eps=1e-5):
    N,C,H,W = x.size()
    x1 = x.reshape(N*C,-1)
    var = x1.var(dim=-1, keepdim&#

了解本专栏

订阅专栏解锁全文

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

AI算法网奇

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

订阅专栏

激活函数总结（四十四）：激活函数补充(NLSIG、EvoNorms)

走在深度学习前沿的小宋

09-26

307

本文为前面介绍的激活函数进行了一些激活函数补充，包括：NLSIG、EvoNorms等激活函数及其在当前激活函数众多的情况下使用的环境。总的来说：NLSIG更偏向于现实生活的情况，在当前很少使用，也并不适合深度学习领域；EvoNorms的话可以一定程度上代替BN+ReLU 的结构，且具有较好的效果，但是会带来复杂度的上升，使用的时候需要进行一定的考虑。。。。

神经网络之激活函数

热门推荐

August-us的博客

03-18

3万+

神经网络中的激活函数系列文章：激活函数是神经网络中非常重要的东西，作用不亚于卷积。激活函数是为了模拟神经元的激活和抑制状态的一个组件，自然界的神经活动都是通过一部分神经元的激活，一部分神经元受到抑制而实现的，同时激活的神经元也会在一定条件抑制，抑制也会转换为激活，这种状态之间的切换，在宏观上就呈现了不同的神经活动。但是卷积神经网络中的激活函数作用不止于此，如果神经网络中只有卷积层，我们...

参与评论您还未登录，请先登录后发表或查看评论

激活函数发展的新里程——EvoNorms

August-us的博客

06-06

2万+

激活函数发展的新里程——EvoNormsEvoNorm-B0pytorch实现EvoNorms-Spytorch实现之所以把这个函数称为激活函数发展的新里程，我的理由就是给人们提供了一种新视角，甚至说打破了之前的固有思维。神经网络为了更加容易训练，提出了Normalization，这种思路取得的成功，使得现在的神经网络越来越离不开归一化。之前写过一篇关于Normalization的文章，是站在框架的角度去写的，有兴趣可以阅读一下，也便于对本文理解深刻。随着网络的发展，归一化通常和激活函数都是在一

归一化EvoNorms

jacke121的专栏

04-10

2728

EvoNorms_PyTorch https://github.com/lonePatient/EvoNorms_PyTorch 原版说精度提升了一个点，但是内存占用比原来大了很多，也变慢了 import torch import torch.nn as nn from torch.nn import init from torch.nn.parameter import Param...

EvoNorm:EvoNorm的非官方PyTorch实施

04-22

不断发展的标准化激活层 Google AI和DeepMind 在培训模式支持下实施EvoNorm S0和B0 使用group_std和instance_std函数解决形状错误解决S0的NaN错误问题修复EvoNorm B0中运行方差计算中的形状错误解决B0的NaN错误问题图1.左图：搜索的归一化激活层的计算图，该层与批次无关，名为EvoNorm-S0。正确：ResNet-50的结果是EvoNorm-S0，因为ImageNet上超过8个工作人员的批处理量从1024变为32。在MobileNetV2和Mask R-CNN上，EvoNorm-S0的性能也优于BN和GN。用法： from evonorm2d import EvoNorm2D # For B0 version evoB0 = EvoNorm2D(input, affine = True, version

超越BN-ReLU！谷歌大脑等提出EvoNorms：归一化激活层的进化

zandaoguang的博客

04-10

1129

点击上方“视学算法”，选择加"星标"或“置顶”重磅干货，第一时间送达本文转载自：机器之心 | 作者：Hanxiao Liu等最近，谷歌大脑团队和 DeepMind ...

探索未来——Evolving Normalization-Activation Layers：革新深度学习的激活与归一化结合层

gitblog_00019的博客

06-23

674

探索未来——Evolving Normalization-Activation Layers：革新深度学习的激活与归一化结合层 EvoNormUnofficial PyTorch Implementation of EvoNorm项目地址:https://gitcode.com/gh_mirrors/ev/EvoNorm 在神经网络的世界里，每一小步的进步都可能引领一场算法革命。今天，我们要向您...

介绍一下EvoNorms

04-19

EvoNorms是一种新的归一化方法，它是从自然进化的角度出发设计出来的。它的设计灵感来自于生物进化过程中的自适应特性，能够自动适应不同任务的输入分布，从而提高模型的泛化性能。EvoNorms相对于传统的归一化方法，...

总结-初步理解归一化网络

CS_W98的博客

07-07

739

LayerNorm,BatchNorm,IN,EN BatchNorm 适合CV图像数据：基于批统计量（C=1）来计算样本的均值和方差（N,H）解决各层内部协变量偏移的问题（也许），使损失平面更加的平滑，从而加快收敛速度，因为有批统计量的需求，所以需要使用指数滑动均值来计算统计量，并保存。缓解了梯度饱和问题（如果使用sigmoid这种含有饱和区间的激活函数的话），加快收敛。 BN的计算是要受其他样本影响的，由于每个batch的均值和标准差不稳定，对于单个数据而言，相对于是引入了噪声，适合hig.

AMiner 会议论文推荐第十四期

AI_Conf的博客

11-27

394

演进中的归一化-激活层

YannicKilcher的博客

08-14

207

这篇论文由来自 Google Brain 和 Google DeepMind 的 Han Jiao Liu、Andrew Brock、Karen Simonian 和 Guo Wili 共同撰写，其主题是关于进化图像神经网络中的归一化激活层。论文指出，现有的图像神经网络架构，如 ResNet、MobileNet 和 EfficientNet，都遵循相似的设计原则，即由包含跳跃连接的模块堆叠而成。...

为什么会出现Batch Normalization层

NodYoung

04-21

9620

训练模型时的收敛速度问题众所周知，模型训练需要使用高性能的GPU，还要花费大量的训练时间。除了数据量大及模型复杂等硬性因素外，数据分布的不断变化使得我们必须使用较小的学习率、较好的权重初值和不容易饱和的激活函数（如sigmoid，正负两边都会饱和）来训练模型。这样速度自然就慢了下来。下面先简单示例一下数据分布的不断变化为什么会带来这些问题，如图：我们使用Wx+b=0对小黄和小绿进行分类。由于

深度学习CV文章整理

DJames23的博客

05-14

7335

1.目标检测 1.HDD-Net：具有hand-crafted和学习到的混合特征检测器和描述符在图像匹配和3D重建等任务上，优于R2D2、D2-Net、SuperPoint和SIFT等，作者团队：帝国理工学院&华为诺亚实验室&慕尼黑工业大学 2.CVPR 2020 | 商汤提出SEPC：应对尺度变化的目标检测新算法 3.DBFace升级，模型仅1.3M的轻量级高精度人脸检测模型 4.RetinaMask：人脸口罩检测新网络 5.目标检测 | 解决小目标检测！多尺度方法汇总 6.PSDet+

求解稀疏优化问题——增广拉格朗日方法+半光滑牛顿法

zandaoguang的博客

04-11

2665

↑↑↑↑↑点击上方蓝色字关注我们！『视学算法』转载作者：邓康康邓康康，福州大学应用数学系在读博士生，研究方向:运筹优化算法设计与应用、流形优化。编者按本文介绍了一种二阶方法去求解稀疏优...

lucene-sandbox-7.2.1.jar中文文档.zip

05-13

# 压缩文件中包含：中文文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

groovy-all-2.5.0-beta-2.jar中文-英文对照文档.zip

05-13

# 压缩文件中包含：中文-英文对照文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文-英文对照文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

h2-1.3.176.jar中文文档.zip

05-13

深刻理解VXLAN 大二层：H3C实验分析与实战分享

05-13

Vxlan大二层配置

基于巴氏系数的协同过滤算法.zip