PaddleDetection自定义数据集踩的小坑
其实我觉得把,自定义数据集这种对小白是非常不友好的,经常应为数据集弄不对而劝退,我要不是因为想白嫖gpu,说实话,在弄自定义数据集的持续踩坑的第二天,就不弄了,真的尴尬。连续一周被数据集出错所支配,上网这看看教程,那看看教程,唉疯球。
- 在所用模型的配置文件中的TrainReader中
data_dir
需要写的是你当前工作路径到dataset点这个路径. -
- 举例(aistudio):
-
-
- aistudio整体路径:
/home/aistudio/PaddleDection/dataset/mydataset/train.txt
, 我们一般的默认工作路径是/home/aistudio
, 那么你的配置文件中的data_dir就应该是/PaddleDetection/dataset, 然后你的anno_path就应该是mydataset/train.txt,对应的train.txt中的路径就应该是mydataset/JPEGImages/xxx.jpg
和mydataset/Annotations/xxx.xml
- aistudio整体路径:
-
- 如果你想用官方给的
PaddleDetection/ppdet/data/source/coco.py
来进行train.txt和valid.txt的转换,注意需要改变这个文件中llabel_list的参数。 -
-
dataset_dir=None, image_dir=None
-