neural network优化小技巧大总结

最新推荐文章于 2023-07-23 20:08:47 发布

小妖精Fsky

最新推荐文章于 2023-07-23 20:08:47 发布

阅读量650

点赞数

分类专栏： DeepLearning 文章标签： neural network trick

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/appleml/article/details/80628944

版权

这篇博客总结了神经网络优化的一些实用技巧，包括交替使用带L2正则化的优化器与不带的优化器，结合预训练与随机初始化的word_embedding，以及word_dropout方法来防止过拟合。这些技巧来源于不同的研究论文，对于提升模型性能有显著效果。

摘要由CSDN通过智能技术生成

看论文收集所得，觉得非常好，特记录在此
(1) 优化器的交替使用
定义两个优化器，其中一个优化器带有L2正则化，另一个优化器不使用L2正则化：

optim1 = optim.SGD(model.parameters(), lr=rela_config.lr, momentum=rela_config.momentum, weight_decay=rela_config.weight_decay)
optim2 = optim.SGD(model.parameters(), lr=rela_config.lr, momentum=rela_config.momentum)

在训练的过程中，两个优化器交替使用，比如在奇数epoch时选择optim1优化器，在偶数epoch时选用optim2优化器
(2)word_embedding的选用
word_embedding用了两种，一种是利用大规模语料训练得出的word_embedding, 另一种是随机初始化的word_embedding. 两个embedding串接作为当前词的word_embedding.
这里写图片描述
如图中所示， <

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
neural network优化小技巧大总结

看论文收集所得，觉得非常好，特记录在此 (1) 优化器的交替使用(2) word_embedding的使用该方法来自与 (3)word_embedding的选用该技巧来自与：未完待续...
复制链接

扫一扫

专栏目录

小妖精Fsky CSDN认证博客专家 CSDN认证企业博客

码龄10年

399: 原创

3万+: 周排名

141万+: 总排名

204万+: 访问

: 等级

1万+: 积分

309: 粉丝

414: 获赞

199: 评论

1132: 收藏

私信

关注

热门文章

分类专栏

Machine Learning 61篇
Java 80篇
NLP 10篇
Text Process 6篇
Eclipse 3篇
正则表达式 10篇
数据结构 16篇
Code 7篇
Java 编程思想 11篇
Latex 16篇
NLPTools 19篇
Linux 35篇
DeepLearning 28篇
C++ 12篇
Shell 3篇
Event Extraction 2篇
PaperNotes 77篇
Python 41篇
TensorFlow 36篇
牛人 4篇
强化学习 1篇
Pytorch 19篇
每日算法 2篇
ML中技巧

最新评论

气哭了的C++调试，cmake 找不到 eigen
Like star.: 很简单，只需要在Cmakelists.txt文件里加入一行： include_directories("/usr/include/eigen3") 然后 colcon build就可以编译成功了
split分割字符串（按两种符号分割）
xxxShine: 请问我如果还想要符号如何操作？
气哭了的C++调试，cmake 找不到 eigen
hiahia_hia1: 我也用的是Eigen源码，怎么把eigen用cmake编译？
JRE not compatible with project .class file compatibility: 1.7
夜半推窗雨: 谢谢！选择项目，右键->properties->Java Compiler->勾选Enable project specific settings，后面的版本号要与项目加载的jre依赖库相同。
Ubuntu 下终端界面转图形界面
Abessa: 终于不用每次黑屏都用重启解决了，感谢大佬

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。