《python深度学习》笔记（十三）：正则化

最新推荐文章于 2024-05-06 23:59:04 发布

码字神经元

最新推荐文章于 2024-05-06 23:59:04 发布

阅读量1.8k

点赞数

分类专栏：《python深度学习》笔记文章标签： python 深度学习开发语言

本文链接：https://blog.csdn.net/qq_59572329/article/details/121584666

版权

《python深度学习》笔记专栏收录该内容

23 篇文章 54 订阅

订阅专栏

1. 什么是正则化

正则化，或者是规范化，英文翻译为Regularization。什么是规则？考试中不能带手机，这就是规则，一个限制。同理，在深度学习中，正则化就是说给损失函数加上一些限制，通过这种规则去规范他们再接下来的循环迭代中，不要自我膨胀。

深度学习中，如果参数过多，模型过于复杂，容易造成过拟合。即模型在训练样本数据上表现的很好，但在实际测试样本上表现的较差，不具备良好的泛化能力。为了避免过拟合，最常用的一种方法是使用使用正则化，例如 L1 和 L2 正则化。正则化的主要作用是防止过拟合，对模型添加正则化项可以限制模型的复杂度，使得模型在复杂度和性能达到平衡。L1正则化和L2正则化可以看做是损失函数的惩罚项。所谓『惩罚』是指对损失函数中的某些参数做一些限制。 L1正则化的模型叫做Lasso回归，使用L2正则化的模型叫做Ridge回归。

2. L1和L2正则化

权重正则化：降低过拟合

L1正则化：：添加的成本与权重系数的绝对值成正比。学习到的模型权重稀疏

L2正则化：添加的成本与权重系数的平方成正比，也叫权重衰减。学习到的模型权重平滑

3. Dropout正则化

在训练的时候，以一定的概率使得某些神经元从网络中丢弃

4.代码实现

torch.optim优化器实现L2正则化
torch.optim集成了很多优化器，如SGD，Adadelta，Adam，Adagrad，RMSprop等，这些优化器自带的一个参数weight_decay，用于指定权值衰减率，相当于L2正则化中的λ参数，注意torch.optim集成的优化器只有L2正则化方法，不能实现L1正则化。

使用torch.optim的优化器，可如下设置L2正则化

    optimizer = optim.Adam(model.parameters(),lr=learning_rate,weight_decay=0.01)

class Regularization(torch.nn.Module):
    def __init__(self,model,weight_decay,p=2):
        '''
        :param model 模型
        :param weight_decay:正则化参数
        :param p: 范数计算中的幂指数值，默认求2范数,
                  当p=0为L2正则化,p=1为L1正则化
        '''
        super(Regularization, self).__init__()
        if weight_decay <= 0:
            print("param weight_decay can not <=0")
            exit(0)
        self.model=model
        self.weight_decay=weight_decay
        self.p=p
        self.weight_list=self.get_weight(model)
        self.weight_info(self.weight_list)
 
    def to(self,device):
        '''
        指定运行模式
        :param device: cude or cpu
        :return:
        '''
        self.device=device
        super().to(device)
        return self
 
    def forward(self, model):
        self.weight_list=self.get_weight(model)#获得最新的权重
        reg_loss = self.regularization_loss(self.weight_list, self.weight_decay, p=self.p)
        return reg_loss
 
    def get_weight(self,model):
        '''
        获得模型的权重列表
        :param model:
        :return:
        '''
        weight_list = []
        for name, param in model.named_parameters():
            if 'weight' in name:
                weight = (name, param)
                weight_list.append(weight)
        return weight_list
 
    def regularization_loss(self,weight_list, weight_decay, p=2):
        '''
        计算张量范数
        :param weight_list:
        :param p: 范数计算中的幂指数值，默认求2范数
        :param weight_decay:
        :return:
        '''
        # weight_decay=Variable(torch.FloatTensor([weight_decay]).to(self.device),requires_grad=True)
        # reg_loss=Variable(torch.FloatTensor([0.]).to(self.device),requires_grad=True)
        # weight_decay=torch.FloatTensor([weight_decay]).to(self.device)
        # reg_loss=torch.FloatTensor([0.]).to(self.device)
        reg_loss=0
        for name, w in weight_list:
            l2_reg = torch.norm(w, p=p)
            reg_loss = reg_loss + l2_reg
 
        reg_loss=weight_decay*reg_loss
        return reg_loss

5.正则化对结果的影响

就整体而言，对比加入正则化和未加入正则化的模型，训练输出的loss和Accuracy信息，我们可以发现，加入正则化后，loss下降的速度会变慢，准确率Accuracy的上升速度会变慢，未加入正则化模型的loss和Accuracy的浮动比较大（或者方差比较大），而加入正则化的模型训练loss和Accuracy，表现的比较平滑。并且随着正则化的权重lambda越大，表现的更加平滑。这其实就是正则化的对模型的惩罚作用，通过正则化可以使得模型表现的更加平滑，即通过正则化可以有效解决模型过拟合的问题。

码字神经元

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
《python深度学习》笔记（十三）：正则化

正则化，或者是规范化，英文翻译为Regularization。什么是规则？考试中不能带手机，这就是规则，一个限制。同理，在深度学习中，正则化就是说给损失函数加上一些限制，通过这种规则去规范他们再接下来的循环迭代中，不要自我膨胀。深度学习中，如果参数过多，模型过于复杂，容易造成过拟合。即模型在训练样本数据上表现的很好，但在实际测试样本上表现的较差，不具备良好的泛化能力。为了避免过拟合，最常用的一种方法是使用使用正则化，例如 L1 和 L2 正则化。
复制链接

扫一扫