手写数字识别网络结构

最新推荐文章于 2024-06-19 13:36:14 发布

zyb-小波

最新推荐文章于 2024-06-19 13:36:14 发布

阅读量9.6k

点赞数

分类专栏：深度学习文章标签：计算机视觉 opencv 开发工具

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37708614/article/details/121676660

版权

深度学习专栏收录该内容

13 篇文章 0 订阅

订阅专栏

本文探讨了非线性网络结构如何增强模型表达力，重点关注卷积神经网络在分类任务中的选择优化目标，如为何采用SoftMax概率输出和最大似然思想。讲解了常见的损失函数——交叉熵，并剖析了不同优化算法如SGD、Momentum、AdaGrad和Adam的原理与在分布式训练中的应用。

摘要由CSDN通过智能技术生成

非线性网络

输入层+隐含层+隐含层+输出层

隐含层数量增加，模型的表达能力越强

卷积神经网络

分类任务选择优化目标

分类任务输出是一个标签，类似牛顿第二定律，采用均方误差时，减去一个标签不合理

发现观测数据和背后规律之间的关系，输出某一标签的概率SoftMax，为什么采用e的指数

最大似然思想

交叉熵分类任务损失函数

优化算法：调整学习率

SGD：minibatch 收敛过程中震荡

Momentum：不仅该minibatch的结果，还要包含之前累积的速度

AdaGrad：学习率逐渐下降，越接近越微调

Adam：融合前两者思想Momentum+AdaGrad

分布式训练多卡

训练过程中优化

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
手写数字识别网络结构

非线性网络输入层+隐含层+隐含层+输出层隐含层数量增加，模型的表达能力越强卷积神经网络分类任务选择优化目标分类任务输出是一个标签，类似牛顿第二定律，采用均方误差时，减去一个标签不合理发现观测数据和背后规律之间的关系，输出某一标签的概率SoftMax，为什么采用e的指数最大似然思想交叉熵分类任务损失函数优化算法：调整学习率SGD：minibatch 收敛过程中震荡Momentum：不仅该mini...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

zyb-小波 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。