【书籍阅读】DeepLearning----第六章-深度前馈网络

最新推荐文章于 2022-12-13 22:16:48 发布

时光机ﾟ

最新推荐文章于 2022-12-13 22:16:48 发布

阅读量218

点赞数

分类专栏： # DeepLearning 读书笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_19784349/article/details/79820249

版权

DeepLearning 读书笔记专栏收录该内容

7 篇文章 0 订阅

订阅专栏

多分类任务下，为什么使用softmax？

事实上，我们最需要的是 $max \{ x_1，x_2，x_3 \}$ ，该函数可以直接得到分类。但问题在于 $max$ 函数不可导，所以就有人设计出了softmax函数

P (y = i) = e x p ( \sum d w i d x d ) \sum j e x p ( \sum d w j d x d )

$P(y=i) = \frac {exp({\sum_d{w_{id}x_d}})}{\sum_jexp(\sum_dw_{jd}x_d)}$ 选择softmax函数有几个原因：

software函数对于特征对概率的影响是乘性的，即其也满足最后输出越大，概率越大的结果。
我们的目标函数经常是交叉熵函数 $L = - \sum k t k l o g P (y = k)$ $L=-\sum_kt_klogP(y=k)$ 使用这个目标函数，乘法变加法，运算简单。

万能近似定理：一个前馈神经网络如果具有一线性输出宠和至少一层具有一种“挤压”性质的激活函数（如Sigmoid激活函数）的隐藏层，只要给予网络足够数量的隐藏单元，它可以以任意的精度来近似任何函数。

反向传播算法和优化算法的关系？

反向传播用于计算梯度，而优化算法（如随机梯度下降）用于使用得到的梯度来进行学习。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。