目标检测的任务
- 目标检测主要是针对图像视觉的一种方法,根据学习到的目标,将目标区域进行位置定位和类别识别,同时需要给出给目标的置信度。
- 如下图所示,输入一张图片,它能够通过目标检测方法,识别出汽车的位置(坐标信息),并给予瞄框,并标注出类别名称,及其置信度值为{0,1}范围内的一个数值。
数据集的获取
拍摄照片是,需要注意进行多方位的拍摄,采用不同的角度,不同的背景来进行拍摄,同时需要注意数据的多样性。
-
数据集下载
数据集:自行车数据集
数据集下载:数据集下载 -
数据集的标注
使用:labelme 来对数据标准。
labelme的标注按照见github:github标注下载 -
标注好的数据处理成能输入的数据集的形式。
目标检测的数据格式一般有两种,voc和COCO的形式。如果使用COCO格式,建议使用PaddleDetection中的x2coco将标注好的文件转为COCO格式的数据集。转换代码如下:
python tools/x2coco.py \
--dataset_type labelme \
--json_input_dir ./labelme_annos/ \
--image_input_dir ./labelme_imgs/ \
--output_dir ./cocome/ \
--train_proportion 0.8 \
--val_proportion 0.2 \
--test_proportion 0.0
如果使用VOC格式的数据集,可以使用labelme自带的labelme2voc.py完成,需要先创建labels.txt文件,labels.txt文件的前两行分别为__ignore__和_background_,其余行为类别名称。转换代码如下:
./labelme2voc.py data_annotated data_dataset_voc --labels labels.txt