详解机器学习中的损失函数

最新推荐文章于 2024-08-03 15:42:15 发布

Wendy_毛毛虫

最新推荐文章于 2024-08-03 15:42:15 发布

阅读量5.1k

点赞数 4

分类专栏： ML

本文链接：https://blog.csdn.net/dwenjun/article/details/81914683

版权

本文详细介绍了机器学习中的损失函数，包括损失函数的作用、经验风险与结构风险、常见的损失函数类型，如0-1损失、平方损失、绝对损失、对数损失和铰链损失，以及它们在不同模型（如线性回归、逻辑回归和支持向量机）中的应用。通过理解这些损失函数，有助于优化模型并提高预测准确性。

摘要由CSDN通过智能技术生成

Class Content

layout post

title 详解机器学习中的损失函数

categories Blog

description 机器学习中常见的损失函数以及它们的特点和适用场景

keywords 机器学习损失函数风险函数

Class	Content
layout	post
title	详解机器学习中的损失函数
categories	Blog
description	机器学习中常见的损失函数以及它们的特点和适用场景
keywords	机器学习损失函数风险函数

1. 前言

我们知道机器学习的三要素是:方法= 模型+策略+算法, 如何从假设空间中选择最优模型,这涉及到我们需要用什么样的准则进行学习,这就是三要素中的”策略”问题。

在假设空间中选择模型 $y(x_n,w)$ 作为决策函数,给定输入 $x_n$ ,由模型得到输出 $y(x_n,w)$ ,而预测的 $y(x_n,w)$ 与真实值 $t_n$ 之间可能不一致,如图1-1 可以看出预测值 $y(x_n,w)$ 与真实值 $t_n$ 存在不一致情况,他们之间的差的绝对值为 $|y(x_n,w)-t_n|$ 为绿色线部分, 而损失函数是定义在单个样本上的，算的是一个样本的误差。因此选用损失函数来度量预测误差。
1-1 预测值与真实值的误差

损失函数（loss function）是用来度量模型的预测值与真实值的不一致程度，是一个非负实值函数,损失函数越小，预测正确程度越高，表示为：

L (y i, f (x i))

$L(y_i,f(x_i))$

损失函数是经验风险函数的核心部分，也是结构风险函数重要组成部分。模型的结构风险函数包括了经验风险项和正则项，可以表示为：
$R s r m (f) = 1 N \sum i = 1 N L (y i, f (x i)) + λ J (f)$ $R_{srm}(f)= \frac{1}{N}\sum_{i=1}^NL(y_i,f(x_i))+\lambda J (f)$
这个公式为结构风险函数,其中,包括前一部分的经验风险项以及后一部分的正则化项,正则化项用于控制模型复杂度, $\lambda$ 则是用于权衡经验风险和模型复杂度之间的关系.
所以,通过最小化结构风险的策略找到最优模型,求解最优模型就是求解如下最优化问题： $m i n f \in ϝ 1 N \sum i = 1 N L (y i, f (x i)) + λ J (f)$ $min_{f\in\digamma}\frac{1}{N}\sum_{i=1}^NL(y_i,f(x_i))+\lambda J(f)$
当然,除了让结构风险最小化寻找最优模型外,还可以直接最小化经验风险,即

$m i n f \in ϝ 1 N \sum i = 1 N L (y i, f (x i))$ $min_{f\in\digamma}\frac{1}{N}\sum_{i=1}^NL(y_i,f(x_i))$

在样本足够的情况下,经验风险最小化可以达到很好的学习效果,但是样本容量有限时,容易产生过拟合现象,所以在才有上面结构风险最小化求最优模型的策略.

2. 区别损失函数\ 风险函数\ 代价函数\ 目标函数

损失函数：衡量单个样本预测值与真实值的误差【不赘述】.
代价函数：定义在训练集上，是模型关于训练集的平均损失，它也叫经验风险，表示为： $1 N \sum i = 1 N L (y i, f (x i))$ $\frac{1}{N}\sum_{i=1}^NL(y_i,f(x_i))$
风险函数：是指损失函数的期望,又叫期望损失，由于输入 $X$ 和输出 $Y$ 是随机变量，那么可求得联合分布 $P(X,Y)$ ，所以可以表示为： $R e x p (f) = E p [L (Y, f (X))] = \int X, Y L (y, f (x)) p (x, y) d x d y$ $R_{exp}(f)=E_p[L(Y,f(X))] = \int_{X,Y}L(y,f(x))p(x,y)dxdy$
目标函数：是一个更为广的概念，比如最小化结构风险求最优模型时，结构化风险函数就是目标函数，而最小化经验风险求最优模型时，经验风险函数就是目标函数，简单地讲，目标函数就是需要优化的函数。

Note：
- a.通常，我们没有细分损失函数和代价函数，经常将两个概念混用。
- b.由于 $P(Y,X)$ 未知，所以风险函数无法计算，经验风险 $R_{emp}(f)$ 是模型关于训练集的平均损失，根据大数定律，当样本容量 $N$ 趋于无穷时，经验风险 $R_{emp}(f)$ 趋于风险函数 $R_{exp}(f)$ ，这也说明了训练集容量越大，选择的最优模型越逼近真实模型。