0x00 前言
训练是一个不断参数调优的过程,这个过程甚至比设计神经网络的过程的时间要长很多。所以你需要一块泰坦。否则训练的过程非常非常非常的漫长。目前博主还买不起泰坦,天天借别人的机器训练了。
0x01 训练
训练中的常见错误:OOM
由于在我的小机器上只有一块2G显存的750Ti,没训练两次就OOM了。
Traceback (most recent call last):
File “C:\Python35\lib\site-packages\tensorflow\python\client\session.py”, line 1139, in _do_call
return fn(*args)
File “C:\Python35\lib\site-packages\tensorflow\python\client\session.py”, line 1121, in _run_fn
status, run_metadata)
File “C:\Python35\lib\contextlib.py”, line 66, in exit
next(self.gen)
File “C:\Python35\lib\site-packages\tensorflow\python\framework\errors_impl.py”, line 466, in raise_exception_on_not_ok_status
pywrap_tensorflow.TF_GetCode(status))
ten