深度网络调参

最新推荐文章于 2023-03-10 07:00:44 发布

xieyan0811

最新推荐文章于 2023-03-10 07:00:44 发布

阅读量351

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xieyan0811/article/details/106750162

版权

深度学习专栏收录该内容

45 篇文章 5 订阅

订阅专栏

重要的超参数

深度学习网络有很多超参数，下面列出了一些比较重要，常常需要调节的超参数。

最重要
学习率
较重要
mini-batch size
hidden units
网络层数
动量参数
学习率衰减

算力不同的调参

算力不同、网络规模、数据量不同，也有不同的调参方法，当模型和计算量较小时，可以使用网格调参；在算力足够的情况下，使用多组参数并行训练模型；反之，如果算力不足，且模型和数据较大，可能需要手动调参，比如训练几天之后，手动下调学习率，动量等超参数，人为地逐渐推进训练过程。

网格调参和随机调参

机器学习中常使用网格调参，即将参数列成表格，按一定步长尝试所有组合的参数，这种方法适用于较小的网络。深度学习网络一般较大，训练时间较长，一般使用随机抽取方法，在重点区域进行更多的抽样（密度更大），这样在一开始不确定哪些超参数重要时，可以广撒网，越往后越有针对性，实现从粗到细调参，同时又兼顾各种可能性，以免陷入局部最优值，类似于蒙特卡洛方法。

非线性轴调参

非线性轴调参也是常见的调参问题，比如设置学习率常常是0.1, 0.01, 0.001, 0.0001…这样就不能用直接将取值范围平均分成n份，每次增加同样步长的方法，如: 0.01, 0.02, 0.03…这样调节效果不好。在这种情况下常使用指数调参，如Pytorch提供的ExponentialLR方法。

另外，还有一些类似情况，比如参数的取值范围在[0,1]之间，可能在中段并不敏感，而在0或1附近非常敏感，也需要使用类似指数或者指数加权平均的累积调参方法。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

xieyan0811 CSDN认证博客专家 CSDN认证企业博客

码龄17年

610: 原创

1万+: 周排名

683: 总排名

247万+: 访问

: 等级

2万+: 积分

4764: 粉丝

2175: 获赞

284: 评论

6724: 收藏

私信

关注

热门文章

分类专栏

论文阅读 90篇
大模型 43篇
机器学习 40篇
研究思考 1篇
深度学习 45篇
算法实战 28篇
Pytorch 14篇
时序 3篇
Docker 4篇
股票数据分析 9篇
大数据 30篇
少儿编程 3篇
移动开发 112篇
linux 34篇
工具 45篇
搭建网站和服务 9篇
Arduino 18篇
Python 26篇
图形图像 20篇
区块链
随笔 9篇
自然语言处理 28篇
未发 1篇

最新评论

论文阅读_检索增强生成 RAG 综述
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
Obsidian+llama3：终于搭建了自己的知识库
艾学习: 有使用案例吗？
论文阅读_OpenAI嵌入+Lucene
征途黯然.: The article is fantastic, and 论文阅读OpenAI嵌入Lucene is truly impressive.
论文阅读_基于嵌入的Facebook搜索
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读_基本于文本嵌入的信息提取
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。