制作自己的语义分割数据集(VOC)
记小孟的艰难项目探险之第一关,数据集
step1:安装labelme
使用anaconda安装,打开anaconda prompt
conda create --name=labelme python=3.6 #创建虚拟环境<labelme>,python版本3.6(可选)
activate labelme # 激活环境
pip install pyqt5 #安装依赖包
pip labelme # 安装主角
labelme # 打开labelme可以开始标注了
以后每一次使用labelme都可以通过annaconda激活labelme环境打开,如图
step2:标注图片。生成json文件
file -> open Dir # 打开待标注图片路径
file ->save automatically #为了方便,设置自动保存
file -> change output dir #设置输出路径,即json文件保存的路径
step3:json转voc,1v1转换(批量转换找了很多参考,一直没成功,以后有时间再研究)
使用labelme自带的labelme_json_to_dataset.exe,位置在C:\Users\studio\Anaconda3\envs\labelme\Scripts
转换语法为
python labelme_json_to_dataset.exe D:/1.json
其中,D:/1.json是标签文件的绝对路径,该语法实现的结果会在1.json文件的同一文件夹内生成新的文件夹1_json,里面存储着有关1.json的相关原图以及标签文件,如图
step4:数据量够的情况下就可以分装文件夹了,voc文件结构如图所示,JPEGImages装的是原图,SegmentationClass装标签文件,ImageSets/Segmentation文件装txt文件,训练时需要用
step5:however,大多数实际情况下,样本量是大问题,不能达到训练量,就需要数据增强,多采用python的数据增强库Augmentor,或者PIL。我还要接着学。