在配置完Nanodet环境之后,准备使用Nanodet训练自己的数据时候,出现了一个ValueError报错,看起来一头雾水,到Github提交Issue发现这个仓库活跃度不是很高,一直没有得到相关帮助。
最后就硬着头皮去想,查找相关文件,发现在yml配置文件中,device设置中batch_size 为160, 我的训练数据集为150,会不会是因为这个原因导致的。
改小了batch_size之后,确保我的训练数据集 / batch_size >=1 ,果然训练成功了。这是一个小的隐形bug, 我们可能开始会用很少一部分数据来测试是否能运行demo, 然后才会正式训练,加上我配置较为简单,一张1050tI 单卡,配置文件里面的device是有多GPU的。