机器学习中的损失函数

最新推荐文章于 2023-05-01 23:44:36 发布

lankuohsing

最新推荐文章于 2023-05-01 23:44:36 发布

阅读量269

点赞数

分类专栏：理论学习学习笔记

本文链接：https://blog.csdn.net/THUChina/article/details/90745789

版权

学习笔记同时被 2 个专栏收录

53 篇文章 0 订阅

订阅专栏

理论学习

46 篇文章 1 订阅

订阅专栏

文章目录

0. 前言
1. logit模型
- 1.1. Odds
- 1.2. logit模型

0. 前言

损失函数一般表示为 $L (f, f (x))$ ,用以衡量真实值 $y$ 和预测值 $f (x)$ 之间不一致的程度。在回归为重，一般

1. logit模型

1.1. Odds

Odds和概率都用来描述某件事情发生的可能性，区别在于概率描述的是事件A出现的次数与所有可能的结果出现的次数之比，Odds描述的是事件A发生的概率与事件A不发生的概率之比。显然，概率的区间是 $[0, 1]$ ,Odds的区间是 $[0,+\infty]$

1.2. logit模型

logit可以理解成log-it（即it的自然对数，这里的it指的就是Odds）。logit变换是从概率 $P\rightarrow Odds\rightarrow Logit$ 的一个变换，数学形式为 $ln\left(\frac{P_i}{1-P_i}\right)$ 。取对数是为了防止数值太大或太小，并且可以让取值由 $[0,+\infty]$ 映射到 $[-\infty,+\infty]$ 。
为什么要用logit模型对概率建模呢？如果要对一个变量建模，最简单的就是线性回归模型，例如： $Y=\beta _0+\beta X,Y \in [-\infty,+\infty]$ 。但是概率是 $[0, 1]$ 的，无法直接用线性回归来对概率建模。如果用logit模型对概率进行一个变换，则可以用线性模型来表示概率了。
$ln\left(\frac{P_i}{1-P_i}\right)=\beta _0+\beta _1x_1+\beta _2 x_2+\cdots+\beta _n x_n \tag{1-1}$
由上式可以得到概率 $P_i$ 的表达式：
$P_i=\frac{1}{1+e^{-(\beta _0+\beta _1x_1+\beta _2 x_2+\cdots+\beta _n x_n)}} \tag{1-2}$
这也是为什么机器学习/深度学习里面喜欢用sigmoid模型来对概率建模的原因。