神经网络基础（三）

最新推荐文章于 2024-09-17 21:17:40 发布

天才第一笔

最新推荐文章于 2024-09-17 21:17:40 发布

阅读量78

点赞数

文章标签：神经网络深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45648459/article/details/130790290

版权

优化器

模型训练的目的是搜索使得损失函数最小的权值向量，也就是我们希望从100等高线到0等高线位置。但是如何能使模型更好且更快的达到效果，就需要优化器。通常会把不同的梯度下降算法封装成一个对象。称为优化器

常见的优化器如：普通梯度下降优化器、动量优化器、Nesterov、Adagrad、Adadelta、

RMSProp、Adam、AdaMax、Nadam。

梯度下降法(1)

梯度下降实则就是求损失值对所有参数的偏导（梯度），梯度的意义是变化最快的方向，因此可以沿着梯度的负方向更新所有参数。学习率LR（Learning Rate，LR）是梯度下降中重要的超参数，根据误差梯度调整权重数值的系数。

梯度下降法(2)

批量梯度下降（BGD）：每次更新使用所有的训练数据，最小化损失函数，如果只有一个极小值，那么批量梯度下降是考虑了训练集所有数据，但如果样本数量过多，更新速度会很慢。

随机梯度下降（SGD）：每次更新的时候只考虑了一个样本点，这样会大大加快训练速度，但是函数不一定是朝着极小值方向更新，且SGD对噪声也更加敏感。

小批量梯度下降（MBGD）：MBGD每次更新的时候会考虑一定数量（batch size）的样本，解决了批量梯度下降法的训练速度慢问题，以及随机梯度下降对噪声敏感的问题。

正则化

正则化是机器学习中非常重要并且有效的减少泛化误差的技术，特别是在深度学习模型中，由于其模型参数多且容易产生过拟合。导致过拟合的一个原因也有可能是数据不纯导致的，如果出现了过拟合就需要我们重新清洗数据。防止过拟合，比较常用的技术包括：

1.数据增强 2. L1/L2正则化 3.Dropout 4.提前终止 5.BN

数据增强

数据增强：即增加训练数据样本。防止过拟合最有效的方法是增加训练样本，足够多的数据可以让模型看见

尽可能多的例外情况并不断修正自己，从而效果更好。数据增强是一个省时有效的方法，在不同领域有不同

的实现方法：

1.在目标识别领域常用的方法是将图片进行旋转、平移、缩放等（图片变换的前提是通过变换不能改变图片所属类别，

例如手写数字识别，类别6和9进行旋转后容易改变类目）。

2.语音识别中对输入数据添加随机噪声。

3.NLP中常用思路是进行近义词替换。

天才第一笔

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

天才第一笔

博客等级

码龄5年

6
原创

0
点赞

0
收藏

1
粉丝

关注

私信

热门文章

最新评论

卷积神经网络
CSDN-Ada助手: 恭喜你写了第四篇博客，探讨了卷积神经网络的相关知识。你的文章简明扼要、深入浅出，让我对卷积神经网络有了更深入的了解。我建议你在下一篇博客中可以探讨一下卷积神经网络在图像处理方面的应用，相信会更加精彩。继续加油！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
神经网络基础（三）
CSDN-Ada助手: 恭喜您又写了一篇关于神经网络的博客！看来您对这个领域非常有热情和深入的了解。在下一步的创作中，建议您可以探讨一些具体的应用案例，让读者更好地理解神经网络在实际场景中的应用。期待您接下来的文章！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
循环神经网络
CSDN-Ada助手: 恭喜您写了第5篇博客，循环神经网络是一个非常有趣的话题。希望您能继续保持创作热情，分享更多有价值的知识和经验。下一步的创作建议，您可以考虑在循环神经网络的基础上，探讨一些实际应用场景，或者深入研究一些相关的技术细节。期待您的下一篇文章！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
神经网络基础（二）
CSDN-Ada助手: 非常感谢你分享了这篇关于神经网络基础的博客！你的文章很详细，很容易理解，让我对神经网络的损失函数和激活函数有了更深刻的认识。除了你提到的内容，我还了解到一些相关的知识，比如正则化技术的应用，如L1和L2正则化，以及dropout技术的作用。希望你能继续写下去，分享更多有关神经网络的知识和经验。如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
神经网络基础（一）
CSDN-Ada助手: 恭喜您开始了博客创作之旅，神经网络是一个有趣且深奥的领域，期待您能够通过自己的努力和不断学习，分享更多有价值的知识。期待下一篇博客的到来。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。