深度学习_L2正则化

phac123

于 2023-02-09 14:23:25 发布

阅读量654

点赞数

分类专栏： Pytorch 文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/weixin_42596275/article/details/128951878

版权

Pytorch 专栏收录该内容

23 篇文章 0 订阅

订阅专栏

文章目录

参考博客
正则化介绍
正则化的实现

参考博客

深入理解L1、L2正则化
 PyTorch 实现L2正则化以及Dropout的操作

正则化介绍

正则化（Regularization）是机器学习中一种常用的技术，其主要目的是控制模型复杂度，减小过拟合。最基本的正则化方法是在原目标（代价）函数中添加惩罚项，对复杂度高的模型进行“惩罚”。其数学表达形式为：
$\check{J}(w; X, y)=J(w; X, y) + \alpha\Omega(w)$
式中 $X, y$ 为训练样本和相应标签, $w$ 为权重系数向量; $J ()$ 为目标函数, $\Omega(w)$ 即为惩罚项, 可理解为模型"规模"的某种度量; 参数 $\alpha$ 控制正则化的强弱. 不同的 $\Omega$ 函数对权重w的最优解有不同的偏好, 因而会产生不同的正则化效果. 最常用的 $\Omega$ 函数有两种, 即 $l_1$ 范数与 $l_2$ 范数, 相应称之为 $l_1$ 正则化和 $l_2$ 正则化.此时有:
$l_1: \Omega(w)=||w||_1=\sum_i|w_i|$
$l_2: \Omega(w)=||w||_2=\sqrt{\sum_iw_i^2}$

正则化的实现

在Pytorch中正则化的实现只需要一行代码, 如下:

optimizer = torch.optim.SGD(model.parameters(), \
lr=config.learning_rate, momentum=0.9, weight_decay=0.000001)

在这个函数调用中 $weight\_decay=0.001$ 就是L2范数.

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

phac123

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
深度学习_L2正则化

L2范数
复制链接

扫一扫

专栏目录

正则化方法：L1和L2 regularization、数据集扩增、dropout

wepon的专栏

03-14

12万+

本文是《Neural networks and deep learning》概览中第三章的一部分，讲机器学习/深度学习算法中常用的正则化方法。（本文会不断补充）正则化方法：防止过拟合，提高泛化能力在训练数据不够多时，或者overtraining时，常常会导致overfitting（过拟合）。其直观的表现如下图所示，随着训练过程，网络在training data上的error渐渐减小，但是在验证集上

深度学习-L2正则化

Der_Dream的博客

03-11

2069

神经网络可能会存在过拟合，那么建议你首先对模型进行正则化处理。虽然使用更多的训练数据是肯定可以解决过拟合问题的，但问题是我们无法获得更多训练数据，即使能获取也太贵了。所以正则化是首选方案。 正则化方法有很多。L2正则化就是其中一种常见的方法。它的实现主要分为两步。第一步，就是在成本函数后面加点“尾巴”；第二步就是在计算偏导数的时候加点“尾巴”。我们以逻辑回归为例来实现L2正则化，求成本函数J的最小...

参与评论您还未登录，请先登录后发表或查看评论

【TensorFlow】正则化方法tf.contrib.layers.l2_regularizer

zuolixiangfisher的博客

05-09

1万+

在tensorflow里提供了计算L1、L2正则化的函数 tf.contrib.layers.l1_regularizer() tf.contrib.layers.l2_regularizer() 我们给出一个实例，代码引用自《TensorFlow 深度学习算法原理与编程实战》p189 这是一个简易的网络模型，实现了通过集合计算一个4层全连接神经网络带L2正则化损失函数的功能 import te...

L2正则化python实现案例(附代码)

02-09

L2正则化python实现案例(附代码)，含图形展示，对于正则化理解又直观帮助

深度神经网络—正则化（一）L2正则化

v_road的博客

07-03

1万+

深度学习可能存在过拟合问题——高方差，有两个解决办法，一是正则化，另一个是准备更多的数据，但由于无法时时刻刻准备足够多的训练数据或者获取数据的成本高，所以通常使用正则化的方法来避免过拟合。 正则化的主要方法有： L2正则化 dropout 数据增广 early stopping Bagging 在样本中增加噪声本篇博客先介绍L2正则化 1. L2正则化公式及参数更新我们代价函数中加入正...

L2正则化

lxiao428的博客

09-26

1612

#正则化是解决共线性的一个很有用的方法，他可以过滤掉数据中的噪声，并最终防止过拟合 #正则化就是引入额外的信息（偏差）对极端权重参数做惩罚。 #特征缩放（如标准化）很重要的一个原因就是正则化。 #为了使正则化起作用，需要保证所有特征的衡量标准保持统一。 #使用正则化方法：在代价函数后面加上正则化项 #正则化参数lambda，减小正则化参数的倒数C的值相当于增加正则化的强度 ...

深度学习——正则化

qq_35470020的博客

02-18

440

正则化是深度学习最常用到的概念，那么首先，我们先了解一下，为什么要用正则化？一、为什么要正则化？看下图，引用吴恩达老师课程中的“房价预测问题”的曲线图，我们可以看到，左侧你和程度不是很好，也就是偏差较大；右图则过拟合，也就是曲线几乎穿过了每一个点，这样的结果是**“泛化”能力很差，泛化是指将当前模型引用于新模型时的表现力，过拟合其实也就是我们说的...

matlab_work.rar_图像 正则化_图像超分辨_正则化分辨率_正则化图像_超分辨图像

09-22

常见的正则化方法包括拉普拉斯正则化、Tikhonov正则化（也称为L2正则化）和L1正则化等。这些方法通过引入正则项来限制模型的复杂性，从而避免过拟合，提高模型的泛化能力。在MATLAB中，可以利用优化工具箱或者图像...

深度学习中的正则化技术：Dropout与L1_L2正则化

# 1. 深度学习与过拟合问题 ## 1.1 深度学习简介 深度学习是一种基于对数据进行表征学习的机器学习范式，通常通过神经网络来实现。...常见的正则化技术包括Dropout、L1正则化和L2正则化等。接下来

tensorflow使用L2 regularization正则化修正overfitting过拟合方式

12-17

L2正则化原理：过拟合的原理：在loss下降，进行拟合的过程中（斜线），不同的batch数据样本造成红色曲线的波动大，图中低点也就是过拟合，得到的红线点低于真实的黑线，也就是泛化更差。可见，要想减小过拟合，减小这个波动，减少w的数值就能办到。 L2正则化训练的原理：在Loss中加入（乘以系数λ的）参数w的平方和，这样训练过程中就会抑制w的值，w的（绝对）值小，模型复杂度低，曲线平滑，过拟合程度低（奥卡姆剃刀），参考公式如下图：（正则化是不阻碍你去拟合曲线的，并不是所有参数都会被无脑抑制，实际上这是一个动态过程，是loss（cross_entropy）和L2 loss博弈的一个过程。训

TensorFlow keras卷积神经网络添加L2正则化方式

09-16

本文将详细探讨如何在TensorFlow Keras框架中为卷积神经网络（CNN）添加L2正则化。 L2正则化是通过在损失函数中添加权重参数的平方和来实现的，其目的是限制模型权重的大小，防止模型过于复杂。在Keras中，我们可以...

机器学习之L1正则化和L2正则化（附源码解析）

qq_38375203的博客

06-10

4038

今天还是机器学习的基础知识内容，也是最基础的哈。首先说一下什么是正则化，其实它就是一个减少方差的策略。那么什么是方差呢？在这里也引入一个和方差相辅相成的概念--偏差。我们通常所说的过拟合现象，也就是指的高方差，就是模型在训练集上训练的超级好，几乎全部都能拟合。但是这种情况如果换一个数据集往往就会非常差， 正则化的思想就是在我们的目标函数中价格正则项，即：在这里正则项有两种，分别是L1和L2，先来看一下两者的表达式：如果加上这种正则项，就是希望我们的代价函数小，同时也希望我们这里的小，这样就说明每个样本

L2 正则化

hwblittlebird的博客

01-02

1万+

概述在训练数据不够多时，或者overtraining时，常常会导致overfitting（过拟合）。其直观的表现如下图所示，随着训练过程的进行，模型复杂度增加，在training data上的error渐渐减小，但是在验证集上的error却反而渐渐增大——因为训练出来的网络过拟合了训练集，对训练集外的数据却不工作。为什么将数据集分为三部分：训练集，开发集，测试集。开发集就是用来避免过拟合的...

L2正则化（Regularization）