极大似然估计、softmax函数与交叉熵损失函数三者的关系

最新推荐文章于 2024-07-18 16:55:19 发布

xlhao的博客

最新推荐文章于 2024-07-18 16:55:19 发布

阅读量3.1k

点赞数

分类专栏：深度学习文章标签：回归

深度学习专栏收录该内容

18 篇文章 2 订阅

订阅专栏

介绍

Logistic的基本形式：

需要明确的概念：

逻辑回归解决的不是回归的问题，而是分类的问题
逻辑回归是线性模型，其中sigmoid函数只是非线性激活函数

极大似然视角下的Logistic

极大似然与伯努利分布

假设 x,y∼B(±1,p)

考虑一个二分类问题：f(x)→{+1,−1} ：

其极大化条件似然估计：

转化成负对数似然损失函数：

L o s s (w) = 1 N \sum i = 1 N l n (1 + e x p (- y i f (x i, w))) （ 损 失 函 数 A ）

需要明确的概念 ：

与逻辑回归对应的是伯努利分布，而不是二项分布（重复N次(N>1)伯努利分布实验）
逻辑回归中，模型的二值输出服从伯努利分布，而输入数据不服从伯努利分布，输入数据服从等方差高斯分布
模型的输出中，线性内积 WTx 所得结果是连续型随机变量，不服从伯努利分布，而经过非线性变换和二值化之后的输出才服从伯努利分布

形式化损失函数视角下的Logistic

注：红线是logistic回归损失函数，绿虚线是SVM损失函数

M a r g i n C o s t : m i n J (w) = 1 n \sum i = 1 n H (y i f (x i, w)), w h e r e H (t) = l n (1 + e x p (- t))

熵的视角下的Logistic

交叉熵函数：

L (y | x) = \sum - P (y i) l n P (f (x i = y i))

相关熵与逻辑回归：

假设 x,y∼B(0,1|p)

考虑一个二分类问题 f(x)→{0,1}, (与极大似然视角下的+1，-1不同)

似然：∏Ni=1P(y|xi,w)=∏Ni=1P(1|xi,w)yiP(0|xi,w)1−yi

交叉熵损失函数（cross-entropy）：

E (w) = - 1 N l n (\prod i = 1 N P (y | x i, w)) = - 1 N \sum i = 1 N [y i l n (P (1 | x i, w)) + (1 - y i) l n (P (0 | x i, w))] （ 损 失 函 数 B ）

负对数似然损失函数 VS. 交叉熵损失函数

因为极大似然视角下的二分类标签为y∗（1，0），这导致其最终的损失函数（损失函数A和损失函数B）的形式不一样，但其最优解是一样的。下面介绍单个实例下两个损失函数如何转换：

令 y∗=2y−1

那么：

所以这两个损失函数是可以相互转化的，只不过对了一个常系数项2，不影响变量的最优解，具体可参考：
https://www.zhihu.com/question/38777817/answer/78140608

Logistic求解

基本问题：无约束凸优化问题

MarginCost:

可用的优化方法：

一阶梯度法（梯度下降及其变种）
二阶梯度法（牛顿法及其变种）

为什么用softmax作为激活函数?

如果logistic回归最后只是需要一个非线性激活函数将线性内积输出 WTx 范围内，那么可不可以不用softmax？（一般不, 考虑到概率机器学习观点）

因为sigmoid刚刚好可以表示为等方差高斯分布下的后验概率

References:

1. 集智公开课
 2. 知乎

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄6年

30
原创

87
点赞

355
收藏

24
粉丝

关注

私信

热门文章

分类专栏

实习 3篇
深度学习 18篇
科研工具 17篇

最新评论

tmux实现利用鼠标和触摸板上下翻页和更改面板大小
guolisen: setw -g mode-mouse on 这是在哪输的啊
vscode设置代码选中高亮
Unicode__wang: { }里每一句话末尾加逗号，最后一句可以不加
vscode设置代码选中高亮
Unicode__wang: 兄弟们全体向我看齐，我是个伞柄原因：在workbench的colorCustomizations里用{ }包括了多行内容，每一句末尾要加逗号！！就像其他几个语言要加分号一样。
vscode设置代码选中高亮
Unicode__wang: 就是editor的selectionhighlight一直在报错，说：具有与所选项相关内容区域的颜色，必须透明，以免隐藏下面的修饰效果。一直是error，不能实现效果，咋回事啊，希望您解答，谢谢
可变形卷积pytorch版本解读
炼丹炼丹: 为什么输入会有offset，offset不是经过卷积后得到的吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。