1 BatchNorm和LayerNorm的区别:1、2
总结:
假设输入为四个维度(batch_size, channel, height, width)
(1)BatchNorm应用在通道(特征)维——channel
(2)LayerNorm应用在样本维——batch_size
对其他三个维度进行归一化
总结:
假设输入为四个维度(batch_size, channel, height, width)
(1)BatchNorm应用在通道(特征)维——channel
(2)LayerNorm应用在样本维——batch_size
对其他三个维度进行归一化