深度学习-问题模型优化

最新推荐文章于 2024-07-10 16:21:11 发布

gao8658

最新推荐文章于 2024-07-10 16:21:11 发布

阅读量1.6k

点赞数

分类专栏：算法研究文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gaoyanjie55/article/details/81779496

版权

本文以问题为导向，探讨了深度学习中CNN和RNN模型的优化方法，包括权重衰减、动量优化、批量归一化等。针对CNN，讨论了ResNet、Inception结构等；对于RNN，提到了LSTM、GRU和注意力机制，以及解决梯度消失和爆炸的方法。文章旨在通过理解这些问题和解决方案，提高模型训练效果。

摘要由CSDN通过智能技术生成

技术是随着问题而产生的，如果不从要解决问题的角度出发应用技术，最终会演化为技术堆砌，并由于每个技术点的副作用进而引起新的问题。

以问题驱动的方式总结常用的模型训练方法和这些训练方法要解决的问题。

这些训练方法一般在论文中都能找到这些较为常用的配置，将分为两个部分，一个部分是CNN，一个部分是RNN。

共性的部分一般放在CNN部分.

1 CNN
1.1 weight decay

解决问题：This prevents the weights from growing too large, and can be seen as gradient descent on a quadratic regularization term 【防止权重过大，起到类似正则化项作用】

https://metacademy.org/graphs/concepts/weight_decay_neural_networks

如何观察：观察weight最终值和整体分布

常用值：

1.2 momentum

解决问题：In this case, you can easily get stuck in a local minima and the algorithm may think you reach the global minima leading to sub-optimal results. To avoid this situation, we use a momentum term in the objective function, which is a value between 0 and 1 that increases the size of the step

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。