L1/L2正则化在Pytorch的实现

最新推荐文章于 2024-07-27 20:21:33 发布

yzZ_here

最新推荐文章于 2024-07-27 20:21:33 发布

阅读量2.8k

点赞数 3

文章标签： L2正则化过拟合 PyTorch 模型训练权重约束

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39333636/article/details/127474090

版权

L1主要是对BN层进行一些约束。L2主要是对参数W进行约束，偏执b相对W来说不影响模型，

自己代码出现过拟合，需要添加L2正则化来处理，记录在此。

参考：http://t.csdn.cn/RAja8

知乎 https://zhuanlan.zhihu.com/p/388415560

假如损失函数是 C0 ，那么L2正则化就是：

然后反向传播求导就是这样

所以梯度下降以后权重更新的公式就是

就会发现实际上是进行普通的梯度下降之前先把原本的 w 乘一个 1−ηλ 系数。

pytorch添加正则化的方法有两种：

一是添加正则化项到损失函数中

代码如下

def l1_regularization(model, l1_alpha):
    l1_loss = []
    for module in model.modules():
        if type(module) is nn.BatchNorm2d:
            l1_loss.append(torch.abs(module.weight).sum())
    return l1_alpha * sum(l1_loss)

def l2_regularization(model, l2_alpha):
    l2_loss = []
    for module in model.modules():
        if type(module) is nn.Conv2d:
            l2_loss.append((module.weight ** 2).sum() / 2.0)
    return l2_alpha * sum(l2_loss)

第二种是在backward()之后，添加正则化项到参数变量的梯度中，然后再进行step()。

代码如下：

def l1_regularization(model, l1_alpha):
    for module in model.modules():
        if type(module) is nn.BatchNorm2d:
            module.weight.grad.data.add_(l1_alpha * torch.sign(module.weight.data))

def l2_regularization(model, l2_alpha):
    for module in model.modules():
        if type(module) is nn.Conv2d:
            module.weight.grad.data.add_(l2_alpha * module.weight.data)

关注

3
点赞
踩
17

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

yzZ_here CSDN认证博客专家 CSDN认证企业博客

码龄7年

47: 原创

39万+: 周排名

4万+: 总排名

13万+: 访问

: 等级

856: 积分

207: 粉丝

301: 获赞

64: 评论

894: 收藏

私信

关注

热门文章

分类专栏

基于tensorrt的yolov5推理实现 8篇

最新评论

windows平台使用tensorRT部署yolov5详细介绍，整个流程思路以及细节。
有闲的小孩新子: 最后上代码的那个代码没看到啊
解决Ubuntu20.04远程时必须连接显示器
@Sean_: 亲测有效!
windows平台使用tensorRT部署yolov5详细介绍，整个流程思路以及细节。
yzZ_here: 最近又在看部署相关的东西，我突然想到一些内容和你分享一下，你大致提到的是在我提供的代码中，你替换了模型的trt文件，发现推理失败（如果没记错的话）。我在思路上是这么理解的：tensorRT的加速逻辑是固定不变，可以理解为他不管你进来的哪个模型的engine文件，它只需要1.创建runtime ->2.加载engine文件并反序列化 ->3.创建context->4.分配内存->5.preprocessImage->6.inference->7.图像后处理。这七步中，极端点的话可以理解为前六步都是固定的，只有第七步是需要针对自己的模型或者场景做特殊处理。所以你说的认为可能是由于咱俩的模型的输出不同，导致后处理阶段报错，可能我的代码中后处理只针对我自己的模型。这一点思路供你参考，也期待我们接着交流一波。
MedSegDiff： Medical Image Segmentation with Diffusion Probabilistic Model
正在学习ros的小趴菜: 您好我想问问这个是怎么进行测试的呢
windows平台使用tensorRT部署yolov5详细介绍，整个流程思路以及细节。
小凃老师: 大佬，我在Windows上运行demo文件报错，具体报错信息我提到issue上去了，https://github.com/stu-yzZ/yolov5infer/issues/1#issue-2376556988

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。