深度学习中对于正则化的理解

最新推荐文章于 2024-09-09 17:08:45 发布

七七鸭灬

最新推荐文章于 2024-09-09 17:08:45 发布

阅读量362

点赞数 2

分类专栏：深度学习理论文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/qq_35768355/article/details/140908546

版权

深度学习理论专栏收录该内容

8 篇文章 0 订阅

订阅专栏

深度学习中正则化是用来解决过拟合问题的，常见的正则化方法有L1正则、L2正则、BN、Dropout

L1和L2正则化之间的区别及优势和应用场景

区别：

L1正则化：在损失函数中添加所有权重绝对值的和作为惩罚项，倾向于产生稀疏的权重矩阵，即很多权重会变成零。
L2正则化：在损失函数中添加所有权重平方的和作为惩罚项，促使权重向零靠近但不会完全变为零，避免了过大的权重。

优势：

L1：可以用于特征选择，因为它倾向于将不重要的特征权重降低到零。
L2：有助于模型更加稳定，避免权重过大导致的模型不稳定或过拟合。

应用场景：

L1：当特征数量远大于样本数量时，或需要特征选择时。
L2：普遍适用，尤其当特征间相关性较低时。

Pytorch中L1正则的实现方式

weight_decay = 0.01  # 权重系数
regularization_loss = 0  # L1正则化的损失

for param in model.parameters():
    # L1正则化的方式，参数的绝对值求和
    regularization_loss += torch.sum(torch.abs(param))

origin_loss = criterion(input=output, target=label)  # 计算原始损失
loss = origin_loss + weight_decay * regularization_loss  # 计算总损失

Batch Normalization的实现及影响

实现：
Batch Normalization在每个批次的数据上对输入进行标准化，使得每层的输入具有稳定的均值和方差。
self.bn = nn.BatchNorm2d(num_features) #num_features为上层网络输出特征的通道数
影响：

加速训练过程，因为每一层的输入都具有稳定分布，有助于避免梯度消失或爆炸问题。
提高模型稳定性，减少对初始化的依赖。
可以视作一种弱正则化手段，有助于减少过拟合。