【深度学习】目标函数

JNingWei

已于 2023-01-25 16:35:45 修改

阅读量1.2w

点赞数 9

分类专栏：深度学习文章标签：深度学习人工智能神经网络计算机视觉

于 2018-02-01 22:18:53 首次发布

本文链接：https://blog.csdn.net/JNingWei/article/details/79232031

版权

深度学习专栏收录该内容

79 篇文章 60 订阅

订阅专栏

Introduction

目标函数是 深度学习之心，是 模型训练 的 发动机 。

目标函数 (object function) = 损失函数 (loss function) = 代价函数 (cost function)

其中，模型loss 统称为 non-decay loss ，正则loss 称为 decay loss 。

作用：

计算预测结果与真实标记之间的误差，并通过 误差反向传播 算法，指挥着 模型参数 哗啦啦地刷新。

目标函数类型

主要分为 分类任务目标函数 和 回归任务目标函数。此外往往会加上 附加任务目标函数 (为了防止过拟合/求得稀疏解而加入的 正则项 )。

分类任务

假设某分类任务共 $N$ 个训练样本，针对网络最后分类层的第 $i$ 个样本的输入特征为 $x_{i}$ ，其对应的真实标记为 $y_{i}\in\{1, 2, ..., C\}$ ，另 $h={(h_{1}, h_{2}, ..., h_{C})}^{T}$ 为网络的最终输出，即样本 $i$ 的预测结果，其中 $C$ 为分类任务类别数。

$y_{i}$ ：分类正确时为1，错误时为0；
$h_{y_{i}}$ ：分类正确的那一个 $h_{j}$ ，可能为负值。

Softmax损失函数

Softmax损失函数（softmax function），又名 交叉熵损失函数 (CE) 。

该函数是重要的深度学习目标函数，也是 Sigmoid函数的一种推广。可转换为交叉熵误差 (CE) 。

$CE(\hat{y}) = - \frac{1}{N} \sum_{k=1}^N [I \{y=y'\} \log(p_t)]$

只对gt所对应的单类 计算loss。
是 最常用 的分类任务目标函数。

合页损失函数

合页损失函数，hinge loss，主要被运用于SVM中。

$L={\frac{1}{N}}{\sum_{i=1}^N}\max\{0, 1-h_{y_{i}}\}$

$max\{0, 1-h_{y_{i}}\}$ ：保证了每个单样本的损失值不为负。

效果略逊于交叉熵损失函数。

坡道损失函数

坡道损失函数，ramp loss function。

亮点是增强了 抗噪能力 。

坡道损失函数和 Tukey’s biweight 损失函数并称 鲁棒损失函数 。

大间隔交叉熵损失函数

引入了SVM的思想，即在要求 分类正确 之外，还额外要求 分开的类需保持较大间隔 。

较难训练。

但在 分类性能 方面优于交叉熵损失函数和合页损失函数。

中心损失函数

在大间隔交叉熵损失函数的基础上，更进一步要求 减小类内差异 。

这里写图片描述

Focal Loss损失函数

对Softmax损失函数进行“类别平衡”约束。

回归任务

预测误差，即残差，用于衡量 模型预测值 与 真实标记 的 靠近程度 。

假设回归问题中，对应第 $i$ 个输入特征 $x_{i}$ 的真实标记为 $y^{i} = (y_{1}, y_{2}, ..., y_{M})^{T}$ ， $M$ 为标记向量总维度，则 $l_{t}^{i}$ 即表示样本 $i$ 上网络回归预测值 $(\hat{y}^{i})$ 与其真实标记在第 $t$ 维的预测误差 (亦称残差) ：