softmax回归与交叉熵损失函数

交叉熵损失函数

在《动手学深度学习》 softmax回归 一节中,交叉熵损失函数比较晦涩,学习csdn上其他博客后有了一定了解,做此记录

softmax回归

softmax回归同线性回归一样,也是一个单层神经网络,但和线性回归不同,softmax回归的输出单元从一个变成了多个,且引入了softmax运算使输出更适合离散值的预测和训练。

由于每个输出的计算都依赖于所有的输入,所以softmax回归的输出层也是一个全连接层。

交叉熵损失函数

引入交叉熵损失函数意义如下:
在这里插入图片描述
为什么交叉熵损失函数最小值可以作为分类预测概率最大值:
此处用到了信息熵、相对熵的概念,参考以下文章
交叉熵损失函数原理详解

交叉熵损失函数与softmax回归

在分类问题中,softmax将输出的结果进行处理,使其多个分类的预测概率值和为1,输出类别的概率分布,再通过交叉熵来计算损失,所以两者经常一起使用。

参考

https://blog.csdn.net/b1055077005/article/details/100152102

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
逻辑回归的损失函数是交叉熵损失函数交叉熵损失函数在逻辑回归起到了关键作用。如果使用平方误差作为损失函数,由于逻辑回归是处理分类问题,损失函数一般不是凸约束的。因此,我们使用交叉熵损失函数来定义逻辑回归的损失。交叉熵损失函数的数学表达式为[-2]: L(w) = -(y * log(a) + (1-y) * log(1-a)) 其,y是样本的实际标签(0或1),a是逻辑回归的预测值(概率值),log表示自然对数。我们的目标是找到一组使得交叉熵损失函数最小的参数w。为了最小化这个损失函数,可以使用梯度下降等优化算法来找到使得损失函数最小的参数w。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [逻辑回归、交叉熵函数、Softmax函数的理解](https://blog.csdn.net/qq_40950382/article/details/88716877)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [大白话5分钟带你走进人工智能-第十七节逻辑回归交叉熵损失函数概念(2)](https://blog.csdn.net/LHWorldBlog/article/details/89678897)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值