【求助】在服务器上跑程序的时候训练终止了,总共要跑60000次迭代,现在跑到15000终止了,怎么在epoch80继续迭代?
【描述】学校服务器显存很小,总是被人挤掉,或者训练一次要花很久的时间,训练过程中老停掉,跑的这份代码里并没有设置继续跑上一次的迭代,导致我每次训练的时候又从epoch 0开始,怎么让它继续执行呢?
【求助】在服务器上跑程序的时候训练终止了,总共要跑60000次迭代,现在跑到15000终止了,怎么在epoch80继续迭代?
【描述】学校服务器显存很小,总是被人挤掉,或者训练一次要花很久的时间,训练过程中老停掉,跑的这份代码里并没有设置继续跑上一次的迭代,导致我每次训练的时候又从epoch 0开始,怎么让它继续执行呢?