L1和L2正则化——PyTorch版本

最新推荐文章于 2023-07-05 16:08:42 发布

我的断点在哪里

最新推荐文章于 2023-07-05 16:08:42 发布

阅读量5.4k

点赞数 5

分类专栏： Deep Learning 文章标签： PyTorch L1/L2 regularization

Deep Learning 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

一、用代码实现L1和L2regularization

weight_decay指定的权重衰减会对网络中所有参数（包括权值W和偏置b）进行操作，如果对b进行L2正则化可能会导致严重欠拟合，所以，一般只需对权值进行正则即可。[不确定？？？]

PS:PyTorch中的regularization在optimizer中实现，通过设定其中的weight_decay参数的值控制正则化的权重大小（即权值衰减率）(默认为L2正则化的权重)。

（1）L1 regularization

$L_{loss}=\left \| y-\hat{y} \right \|^2+\lambda | W |$

L1正则化让权重向量在优化过程中变得稀疏。

PyTorch中的optimizer只能实现L2正则化，L1正则化需要手动实现：

regularization_loss = 0
for param in model.parameters():
    regularization_loss += torch.sum(abs(param))

classify_loss = criterion(pred,target)
loss = classify_loss + lamda * regularization_loss

optimizer.zero_grad()
loss.backward()
optimizer.step()

（2）L2 regularization

$L_{loss}=\left \| y-\hat{y} \right \|^2+\lambda \left \| W \right \|^2$

权重衰减系数 $\lambda$ 在初步尝试时可以使用1e-4或1e-3。

在PyTorch中某些optimizer优化器的参数weight_decay就是L2正则项，默认值为0。

optimizer = torch.optim.SGD(model.parameters(), lr=0.01, weight_decay=0.001)
or
optimizer = torch.optim.Adam([{'params': model.base.parameters(), 'lr':1e-3},
                              {'params':model.classifier.parameters(),'lr':1e-4}],
                              lr=1e-2, momentum=0.9, weight_decay=1e-5)

Reference:

https://blog.csdn.net/qq_36589234/article/details/89298999

https://blog.csdn.net/LoseInVain/article/details/81708474

https://blog.csdn.net/guyuealian/article/details/88426648#2.1%20%E6%9C%AA%E5%8A%A0%E5%85%A5%E6%AD%A3%E5%88%99%E5%8C%96loss%E5%92%8CAccuracy

我的断点在哪里

关注

5
点赞
踩
23

收藏

觉得还不错? 一键收藏
1
评论
L1和L2正则化——PyTorch版本

一、用代码实现L1和L2regularizationweight_decay指定的权重衰减会对网络中所有参数（包括权值W和偏置b）进行操作，如果对b进行L2正则化可能会导致严重欠拟合，所以，一般只需对权值进行正则即可。[不确定？？？]PS:PyTorch中的regularization在optimizer中实现，通过设定其中的weight_decay参数的值控制正则化的权重大小（即权值衰减...
复制链接

扫一扫