分类问题损失函数的由来

最新推荐文章于 2022-02-27 11:36:22 发布

kakarotte99

最新推荐文章于 2022-02-27 11:36:22 发布

阅读量414

点赞数

分类专栏：机器学习基础知识文章标签：损失函数分类问题

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42433740/article/details/101273795

版权

这篇博客探讨了分类问题中交叉熵损失函数的推导过程，从二分类问题开始，介绍了如何通过sigmoid激活函数将输出规范化。博主解释了最大化条件概率的目标，通过ln函数转换，提出损失函数L(y^, y)。接着，讨论了多分类问题，指出它是二分类的拓展，涉及softmax激活，并提到了OVO和OVR策略。最后，给出了多分类问题的损失函数形式。" 86602424,8289846,Linux磁盘管理：分区、挂载、文件系统与加密,"['Linux系统', '磁盘管理', '文件系统', '分区', '加密']

摘要由CSDN通过智能技术生成

交叉熵损失函数的推导过程

以二分类为例，假设我们使用的激活函数为sigmoid，即将输出规范化在 $[0, 1]$ 之间， $p (y ∣ x)$ 表示在给定 $x$ 的基础上输出为 $y$ 的概率。我们设： $y=1时：p(y|x)=\hat{y}$
则：
$\hat{y}$
把上述两个表达式合并成一个，则：
$\hat{y}^y(1-\hat{y})^{1-y}$

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分类问题损失函数的由来

使用机器学习或深度学习来进行分类时，一个常用的损失函数叫交叉熵损失函数，那么为什么是它？仅仅是人为定义吗？我们来进行一个简单的推导
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。