总目标:建立VOC格式数据集类以及操作内置函数
github项目地址(附有使用说明书):
https://github.com/A-mockingbird/VOCtype-datasetOperation
Day1:建立VOC格式数据集类,编写解析数据集,获取标注框信息的方法
1.VOC类
初始化参数:
(1)数据集标签存储地址(可选)
(2)数据集图片存储地址(可选)
(3)数据集中的类别数目(可选)
class VOC(object):
def __init__(self, dataset_anno, dataset_img=None, num_class=None):
if os.path.exists(dataset_anno) == False:
raise FileNotFoundError
self.dataset_anno = dataset_anno
self.dataset_img = dataset_img
self.num_class = num_class
self.dirname = os.path.dirname(self.dataset_anno)
self.listanno = self._listanno()
2.解析单个xml文件
需要加载的模块:i