【损失函数】(一) L1Loss原理 & pytorch代码解析

Lcm_Tech

已于 2024-01-15 18:47:12 修改

阅读量3.6k

点赞数 2

分类专栏：损失函数深度学习文章标签： pytorch 人工智能 python

于 2023-07-25 15:40:14 首次发布

本文链接：https://blog.csdn.net/Lizhi_Tech/article/details/131918288

版权

深度学习同时被 2 个专栏收录

22 篇文章 51 订阅

订阅专栏

损失函数

5 篇文章 0 订阅

订阅专栏

1.简介

在这个系列里面，我们对常用的损失函数做一个总结，理解其原理和分析适用场景。

2.L1loss

L1loss其实就是我们最好理解的绝对值损失，也叫MAE损失，其实就是计算每个样本的差的绝对值，公式为：

$loss(x,y)=L=\left \{l_{1},...,l_{N} \right \}^{T},l_{n}=\left | x_{n}-y_{n} \right |$

3.思考

L1loss由于它的直观性和可解释性，常用来作为回归模型的损失函数。同时它最大的一个特点就是可以得到稀疏解。

何为稀疏解呢？当模型中的很多权重都接近于0时，这样的话某一特征输入进来对最终输出就是没有贡献的，因此可以实现特征选择，从而简化模型和提高泛化性。

那么为什么L1loss可以得到稀疏解呢？从梯度的角度来说，L1loss求导始终为一个常数：

$\frac{\partial L_{1}}{\partial w_{i}}=sign(w_{i})=(1) or (-1)$

这样每次梯度下降的速度都是一个常数，所以权重始终是可以到达0点的，而L2loss的梯度会随着 $w_{i}$ 本身的衰减而衰减，因此难以到达0点。

但同时这也是L1loss的一个缺点，当到达0点之后它的梯度就不再存在，所以不会再进行更新，所以L1loss一般也只使用在简单模型上。

4.pytorch代码

以下代码为pytorch官方L1loss代码，可以看到里面有几个参数，我们大多数情况下使用默认参数设置就好。

torch.nn.L1Loss(size_average=None, reduce=None, reduction='mean')

其中：

size_average表示是否将样本的loss进行平均之后输出，默认为true。
reduce表示是否将输出进行压缩，默认为true。当它为false的时候就会无视size_average。
reduction表示用怎么的方法进行reduce。可以设置为'none','mean','sum'。

import torch
import torch.nn as nn
 
 
a = torch.randn((3, 5)) # [m, n]
b = torch.randn((3, 5)) # [m, n]
criterion = nn.L1Loss()
c = criterion(a, b) # [1]
 
criterion = nn.L1Loss(reduce=False)
c = criterion(a, b) # [m, n]

业务合作/学习交流+v：lizhiTechnology

如果想要了解更多损失函数相关知识，可以参考我的专栏和其他相关文章：

损失函数_Lcm_Tech的博客-CSDN博客

【损失函数】(一) L1Loss原理 & pytorch代码解析_l1 loss-CSDN博客

【损失函数】(二) L2Loss原理 & pytorch代码解析_l2 loss-CSDN博客

【损失函数】(三) NLLLoss原理 & pytorch代码解析_nll_loss-CSDN博客

【损失函数】(四) CrossEntropyLoss原理 & pytorch代码解析_crossentropyloss 权重-CSDN博客

【损失函数】(五) BCELoss原理 & pytorch代码解析_bce损失函数源码解析-CSDN博客

如果想要了解更多深度学习相关知识，可以参考我的其他文章：

深度学习_Lcm_Tech的博客-CSDN博客

【优化器】(一) SGD原理 & pytorch代码解析_sgd优化器-CSDN博客

【图像生成】(一) DNN 原理 & pytorch代码实例_pytorch dnn代码-CSDN博客

Lcm_Tech

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
【损失函数】(一) L1Loss原理 & pytorch代码解析

在这个系列里面，我们对常用的损失函数做一个总结，理解其原理和分析适用场景。
复制链接

扫一扫

专栏目录