跑代码报错汇总
sinat_40147910
这个作者很懒,什么都没留下…
展开
-
KGAT_last-fm报错
报错(139报错)原创 2020-07-11 19:19:38 · 286 阅读 · 0 评论 -
epoch跑到一半,出现loss is nan ,如何解决
跑推荐系统tensorflow代码时,跑到110多epoch时,报错 eeror: loss is nan 之后停止.原因: 一般做法是减小学习速率(设为0.001或0.0001)或者增大batch_size(1024) 。尝试了一下减小学习速率,可以解决问题如果一开始跑代码就报错: loss is nan输入可能有问题梯度爆炸了学习率\参数等大小不合适损失函数不对BN不合适...原创 2020-07-10 14:47:14 · 2325 阅读 · 0 评论 -
tensorflow-gpu 1.8 跑lightgcn代码,用服务器跑代码跑到100多或300多与服务器连接中断,想从断点处接着训练,但是却报错
采用这篇博客里的断点训练https://blog.csdn.net/txpp520/article/details/104406880?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.edu_weight&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2原创 2020-07-10 14:26:00 · 436 阅读 · 0 评论