神经网络模型底层原理与实现4—权重衰退、丢弃法、数据增广等小技巧

最新推荐文章于 2024-07-10 16:50:08 发布

爱学习的uu

最新推荐文章于 2024-07-10 16:50:08 发布

阅读量489

点赞数 6

文章标签：深度学习机器学习神经网络人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_60792028/article/details/137103841

版权

情况说明：工作日只能地铁上手机码字，因此无法更新相关代码，工作日会统一更新，感兴趣的可以先点个关注喔

这篇补充前面提到的权重衰退、丢弃法、数据增广、微调的理论知识

1、权重衰退（即加惩罚函数）

目的：控制模型的容量，一般思路是给目标函数加惩罚函数，使得w的值不会过大

则可得参数的更新公式为

wt+1=wt-n*损失函数对w的偏导

把第一个式子带入上面的式子可得第二个式子，因此可知权重是不断变小的，称为权重衰减

2.丢弃法

思路：好的模型应该要抗干扰噪音，因此考虑在层之间加上噪音的同时保持每层的输出不变，数学算法如下

通常把丢弃法用在多层神经网络最后一个隐藏层的输出上

注意：只在训练集时做丢弃，测试集上用效果最好的那个丢弃结果

3.数据增广：产生更多样本

数据增强：加噪音或改变图片的颜色和形状

翻转：（上下或左右翻转，注意不要乱翻，比如你把一个猫上下倒过来就不适合当样本了）

切割：切一小块然后变换到原大小

关注

6
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
神经网络模型底层原理与实现4—权重衰退、丢弃法、数据增广等小技巧

情况说明：工作日只能地铁上手机码字，因此无法更新相关代码，工作日会统一更新，感兴趣的可以先点个关注喔。思路：好的模型应该要抗干扰噪音，因此考虑在层之间加上噪音的同时保持每层的输出不变，数学算法如下。把第一个式子带入上面的式子可得第二个式子，因此可知权重是不断变小的，称为权重衰减。目的：控制模型的容量，一般思路是给目标函数加惩罚函数，使得w的值不会过大。这篇补充前面提到的权重衰退、丢弃法、数据增广、微调的理论知识。注意：只在训练集时做丢弃，测试集上用效果最好的那个丢弃结果。则可得参数的更新公式为。
复制链接

扫一扫

爱学习的uu CSDN认证博客专家 CSDN认证企业博客

码龄3年

39: 原创

2万+: 周排名

3万+: 总排名

2万+: 访问

: 等级

1077: 积分

448: 粉丝

674: 获赞

3: 评论

284: 收藏

私信

关注

热门文章

最新评论

kaggle竞赛实战1
普通网友: 感谢大佬分享好文，学到了不少新知识，支持大佬，期待大佬持续输出优质文章！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
你绝对没看过的求职及职场经验分享1—面试篇
普通网友: 好文！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
模型套路1——神经网络模型训练
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/618289361。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。