1、安装MMdetection
查看官方的安装文档:https://mmdetection.readthedocs.io/zh_CN/latest/get_started.html#id2
从git上面下载方法,需要注意最后这个命令。
2、准备voc格式数据集
MMdetection支持coco和voc数据集两种格式,也可以自定义数据集。最好使用的是coco格式,我先用的是voc格式,所以介绍一下voc格式。
首先需要了解一下voc数据集的格式:
自己数据集转换为voc数据集格式的代码:
import os
from glob import glob
import cv2
from lxml.etree import Element, SubElement, tostring
import numpy as np
# YOLO格式的txt转VOC格式的xml
def convert(img, box):
name, x, y, w, h = box
img_w = img.shape[0]
img_h = img.shape[1]
x = float(x) * img_h
w = float(w) * img_h
y = float(y) * img_w
h = float(h) * img_w
x = (x * 2 - w) / 2
y = (y * 2 - h) / 2
# print(name)
# print((x,y,w,h))
# exit()
return name, x, y, w, h
# 单个文件转换
def