采用paddlelabel标注出来的rec_gt.text去训练没有报错。
采用自行构建的数据集或者通用中英文数据集去训练报错:
with msg: Traceback (most recent call last) list out of range
主要原因是.txt文件中数据格式的问题,但不管你改成什么样都会报错。
原数据格式格式如下:
/imgs/001.png 且热云逛出脱
看着和官方文档中的格式一样,其实不是的。
“png”和“且”中间的空格不一样,通过复制paddlelabel生成的格式替换一下就可以了。
应改成如下:
/imgs/001.png 且热云逛出脱
总结:将图片名和图片文本中间的间隔替换一下就可以了。