深度学习中的组归一化（GroupNorm）

最新推荐文章于 2025-03-05 22:55:09 发布

yuanlulu

最新推荐文章于 2025-03-05 22:55:09 发布

阅读量1.9w

点赞数 21

分类专栏： python 深度学习论文笔记和实践

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yuanlulu/article/details/84190971

版权

DL/ML/AI 同时被 3 个专栏收录

88 篇文章

订阅专栏

65 篇文章

订阅专栏

59 篇文章

订阅专栏

批归一化（BN）的缺点

BN 需要用到足够大的批大小（例如，每个工作站采用 32 的批量大小）。一个小批量会导致估算批统计不准确，减小 BN 的批大小会极大地增加模型错误率。加大批大小又会导致内存不够用。

在这里插入图片描述

归一化的分类

在这里插入图片描述
BN，LN，IN，GN从学术化上解释差异：

BatchNorm：batch方向做归一化，算N*H*W的均值
LayerNorm：channel方向做归一化，算C*H*W的均值
InstanceNorm：一个channel内做归一化，算H*W的均值
GroupNorm：将channel方向分group，然后每个group内做归一化，算(C//G)*H*W的均值

LN 和 IN 在视觉识别上的成功率都是很有限的，对于训练序列模型（RNN/LSTM）或生成模型（GAN）很有效。

所以，在视觉领域，BN用的比较多，GN就是为了改善BN的不足而来的。

GN 把通道分为组，并计算每一组之内的均值和方差，以进行归一化。GN 的计算与批量大小无关，其精度也在各种批量大小下保持稳定。可以看到，GN和LN很像。

怎么做

在现有深度学习框架下可以轻松实现组归一化。
在这里插入图片描述

效果

杠杠滴
在这里插入图片描述

参考资料

FAIR何恺明等人提出组归一化：替代批归一化，不受批量大小限制

组归一化（Group Normalization）的解释

博客等级

码龄17年

299
原创

1693
点赞

5197
收藏

1631
粉丝

关注

私信

热门文章

分类专栏

最新评论

llamafactory使用8张昇腾910b算力卡lora微调训练qwen2-72b大模型
ccjb88888: 一张卡2分钟20个样本，可谓是慢到极致
mindie1.0新特性及调试问题总结
风尘仆: 好的。已解决
mindie1.0新特性及调试问题总结
yuanlulu: 你确认下你的transformers版本是否正确
mindie1.0新特性及调试问题总结
风尘仆: 遇到过这种报错吗？AttributeError: 'ModelRunner' object has no attribute 'generate_position_ids' 2025-04-14 18:19:45,610 [ERROR] model.py:42 - [Model] >>> return initialize error result: {'status': 'error', 'npuBlockNum': '0', 'cpuBlockNum': '0'} [ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared! [ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared! [ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared! [ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared! [ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared! [ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared! [ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared! [ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared!
使用vllm docker容器部署大语言模型
m0_37567301: 这是啥意思啊，怎么启动，进去容器启动吗

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。