目录
Tips:融入模块后的网络经过测试,可以直接使用,设置好输入和输出的图片维度即可
1. 介绍
本文实现了一个结合VGG卷积神经网络和最新Transformer模块的混合架构,特别适用于计算机视觉任务。下面我将详细解析这个实现的各个组成部分。
RMSNorm (Root Mean Square Layer Normalization)
-
作用:替代传统的LayerNorm,计算更高效且效果相当
-
特点:
-
只计算输入的均方根值进行归一化
-
使用可学习的缩放参数
-
计算量比LayerNorm少约20%
-