caffe运行不停止_Caffe训练深度学习网络的暂停与继续

最新推荐文章于 2024-04-23 01:33:40 发布

生活家小不点

最新推荐文章于 2024-04-23 01:33:40 发布

阅读量532

点赞数

文章标签： caffe运行不停止

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42322467/article/details/111975004

版权

标签：

Caffe训练深度学习网络的暂停与继续

博主在训练Caffe模型的过程中，遇到了如何暂停训练并断点继续训练的问题。在此记录下有关这个问题的几种解决方案。更新于2018.10.27。

方法1：临时暂停

这种方法是用于临时暂停Caffe训练，暂停后可以以完全相同的配置从断点处继续训练。如果此时训练中记录了log文件，那么继续后，从log文件中完全看不出暂停的痕迹，是一份完整的记录。

但是，这样暂停后，虽然查看GPU的使用率为0，但仍然无法释放程序所占用的那一部分GPU，也就是说，无法暂停后训练另外的网络，或测试非常大的网络。且，此时的终端不能关闭。

命令

暂停：

Ctrl+z

开始：

fg

回车

方法2：停止训练，下次训练从记录的参数开始

这种暂停方法其实相当于多次训练，区别是，继续训练时，可以用之前暂停时得到的参数初始化网络。也就是说，这种暂停再开始后可以看成是对之前网络的finetune。为了实现这种继续训练的目的，需要在训练时编辑solver文件，设定snapshot，从而保证训练过程每隔一段间隔就会记录一次参数。

好处是，停止后，GPU完全释放，可以进行其他的操作。

标签：

来源： https://blog.csdn.net/ShuqiaoS/article/details/83419199

生活家小不点

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
caffe运行不停止_Caffe训练深度学习网络的暂停与继续

标签：Caffe训练深度学习网络的暂停与继续博主在训练Caffe模型的过程中，遇到了如何暂停训练并断点继续训练的问题。在此记录下有关这个问题的几种解决方案。更新于2018.10.27。方法1：临时暂停这种方法是用于临时暂停Caffe训练，暂停后可以以完全相同的配置从断点处继续训练。如果此时训练中记录了log文件，那么继续后，从log文件中完全看不出暂停的痕迹，是一份完整的记录。但是，这样暂停后，虽...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。