lst/rec文件
准备好训练样本后,需要把mxnet组织成lst或rec文件才可以送入DataIter展开训练. 生成rec文件的前提也是先成lst文件.mxnet源码中有im2rec.py脚本支持输入图片路径,输出lst或rec,但它的功能很强大,参数也变的复杂了,不方便记忆. 本文重点介绍lst文件格式,并提供一个简单的脚本,模拟im2rec.py,输入图片路径,输出lst文件
lst文件格式
- 一行表示一个图片
- 一行中第一列是图片ID, 最后一列是相对于root的路径 (root是要作为参数传入DataIter)
- 第一列和最后一列之外都是label (从0开始的浮点数)
- 一行之间用tab分隔
im2rec.py 支持的路径结构如下
root
-folder for class 1
-folder for class 2
-folder for class 3
….
-folder for class N
子目录名可以是字符串,im2rec.py会自动转换成label