关于如何选择训练模型中的随机种子

最新推荐文章于 2025-03-12 16:38:25 发布

wwqily

最新推荐文章于 2025-03-12 16:38:25 发布

阅读量2.7k

点赞数 9

分类专栏：学习文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wwqily/article/details/135393279

版权

学习专栏收录该内容

3 篇文章

订阅专栏

本文探讨了在深度学习中设置随机种子（如torch.manual_seed(3407)）的重要性，尽管它有助于模型复现，但模型训练中的其他随机因素（如SGD的随机采样）仍可能导致结果难以完全一致。特别是在预训练模型中，随机种子的设定至关重要。作者尝试了根据文本嵌入调整随机种子以提高部分数据集的精度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

寻找办法1：

torch.manual seed(3407) is all you need: On the influence of random seeds in deep learning architectures for computer vision

参考论文：https://arxiv.org/abs/2109.08203v1

于是设置随机种子为3407，但是并无效果；

寻找办法2：

参考文章：【调参侠的修炼笔记2】随机种子Seed的讲人话解释 - 知乎

补充知识：

1、随机种子及其作用？

随机种子的作用是固定模型训练过程中所产生的随机数，便于模型在复现的时候可以最大程度地逼近描述效果。

真正的随机数是物理意义上真是产生的，物理意义上的随机数具有独立性和均匀性，而且难以寻找结果产生的规律。对于机器控制的随机过程而言，参与计算的“随机数”，也就是伪随机数，是通过一定规律产生的，即过程可控的，这种规律叫做随机数生成器。

2、为什么固定了随机种子值，但依旧存在难以完全复制效果的情况？

模型训练不只是有随机数这一个随机过程，例如模型使用SGD等优化算法，这些方法本身带有随机性，每次迭代更新都是随机采样batch size个样本的平均梯度来更新全职。虽说随机种子一定程度上降低了随机性，但由于这些方法本身敏感，结果的细微差别依旧难以避免。

3、随机种子如何进行设置？

随机种子的设定对大部分模型不会产生特别大的实质性影响，神经网络更多会和迭代次数、学习率等相关。但对于预训练模型而言，非常依赖参数的随机初始化过程，那么对于这样的场景，随机种子的设定就显得非常重要。

最后还是没有解决掉这个问题，后来采取的方式是，根据文本嵌入的不同调整了随机种子，确实能在部分数据集复现达到原论文精度。

博客等级

码龄6年

5
原创

46
点赞

49
收藏

35
粉丝

关注

私信

热门文章

分类专栏

学习 3篇
error 1篇

最新评论

关于如何选择训练模型中的随机种子
CSDN-Ada助手: 恭喜你写了关于选择训练模型中随机种子的博客！这是一个非常有用的主题，我很喜欢你深入探讨了这个话题。接下来，我建议你可以尝试探讨一些关于不同随机种子对模型训练结果的影响，或者是如何在实际项目中选择最合适的随机种子。期待你更多的分享，加油！
使用Bert报错：Bert输出为字符串
CSDN-Ada助手: 恭喜你写了第四篇博客！看到你在使用Bert时遇到的问题，我也曾经遇到过类似的困惑。我觉得你可以尝试检查一下输入数据的格式，以及Bert模型的输出设置，或许可以找到解决的办法。希望你能继续分享自己的学习和实践经验，也期待你在下一篇博客中分享你的解决方案。加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
conda create -n name python=3.7无法创建问题合集
CSDN-Ada助手: 非常感谢您分享这篇博客！看到您总结了在跑模型时遇到的问题，让人感到十分欣慰，因为这些问题也许会困扰到其他人。希望您能继续分享关于Python模型跑偏的经验。同时，我想补充一些关于conda环境管理的知识，比如如何在conda环境中安装不同版本的库或者如何解决环境冲突的问题。希望这些信息能对您有所帮助。期待您更多的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
遇到问题：word2vec文本嵌入变换为使用BERT
wwqily: 奥，对了，得到的test_acc和test_f1一直保持不变。也调整了参数，但是没有效果

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。