1.采集好图片,给图片做标注:
给图片进行统一重命名,裁剪,调整分辨率,做旋转镜像等增强,都可以用美图秀秀批量处理小程序。
这里有个特别好用的一个图片标注工具“labelimge”,下载使用教程参考博客: http://blog.csdn.net/zzzzzzz0407/article/details/70267163
标注好后,会得到每张图片对应的xml文件。
2.yolo训练数据
包括train和validate。train包括:trainImageId.txt (图片名列表),trainImgePath.txt (图片路径列表),trainImage(所有图片和用脚本将xml转化出的txt标签,对yolo要吧每张图片标签的xml转化成txt);validate同理。
把脚本和Imgae,标签ImageXML放在同一目录下,运行脚本(先traindata.py 后trans.py)会自动生产所需的文件。然后手动把trainlabeltxt的所有文件考到trainimge里,val同理。
脚本:链接: https://pan.baidu.com/s/1dFw0ZTZ 密码: fnfv
训练时可能出现的问题
无法打开图片
1.python编码问题,把imgaepath.txt里的内容,拷贝到一个新的txt里替换原来的就好。
2.如果是trainimage/valimage里的图片无法正常打开浏览,把原图过去替换就好。
**[注]在使用trans.py时注意修改要检测的目标类别**
3.pvanet训练数据
结构:VOC2007目录下三个文件夹: Annotations(每张图片的标签.xml),JPEGImages(图片.jpg), ImageSets文件夹。