飞桨百度架构师手把手带你零基础实践深度学习——手写数字识别损失函数的优化

AMBPOTIAL

于 2020-08-15 15:36:16 发布

阅读量334

点赞数

分类专栏：飞桨深度学习笔记文章标签：深度学习 python paddlepaddle

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_49887018/article/details/108021610

版权

我们上一节学的是将网络结构进行优化，接下来我们看是否能将损失函数进行优化
在这里插入图片描述均方误差是我们在房价预测模型中使用的损失函数，显然适用于线性回归模型，实数输出与标签相减，而在分类问题中是不太合适的。
我们这个模型的期望输出是一个标签的概率。

SoftMax函数

所有输出和为1.
网络结构变化：单一输出（实数值）->每个分类一个输出（概率）
$softmax(x_i) = \frac {e^{x_i}}{\sum_{j=0}^N{e^x_j}}, i=0, ..., C-1$

为什么使用softmax折算概率？
若为二分类问题（两个标签），等价于单一输出接入sigmoid函数。在这里插入图片描述 z为1的概率为0.6，z为0的概率为0.4
在这种情况下，只有一层的模型为 $S(w^{T}x_i)$ ， $S$ 为Sigmoid函数。模型预测为1的概率为 $S(w^{T}x_i)$

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
飞桨百度架构师手把手带你零基础实践深度学习——手写数字识别损失函数的优化

我们上一节学的是将网络结构进行优化，接下来我们看是否能将损失函数进行优化均方误差是我们在房价预测模型中使用的损失函数，显然适用于线性回归模型，实数输出与标签相减，而在分类问题中是不太合适的。我们这个模型的期望输出是一个标签的概率。SoftMax函数所有输出和为1.网络结构变化：单一输出（实数值）->每个分类一个输出（概率）softmax(xi)=exi∑j=0Nejx,i=0,...,C−1softmax(x_i) = \frac {e^{x_i}}{\sum_{j=0}^N{e^x_j}
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。