注册数据集类型
1、mmseg/datasets/中创建数据集类型py文件,指定CLASSES、PALETTE,修改__init__函数参数,更新影像和标注后缀。
2、mmseg/datasets/__init__.py中添加类型,并更新__all__
# add
from .c6 import C6Dataset
3、configs/_base_/datasets/中添加该类型的数据集元数据,更新dataset_type、data_root、crop_size、pipeline等。
数据一般在data目录,结构参考:
├── data │ ├── my_dataset │ │ ├── img_dir │ │ │ ├── train │ │ │ │ ├── xxx{img_suffix} │ │ │ │ ├── yyy{img_suffix} │ │ │ │ ├── zzz{img_suffix} │ │ │ ├── val │ │ ├── ann_dir │ │ │ ├── train │ │ │ │ ├── xxx{seg_map_suffix} │ │ │ │ ├── yyy{seg_map_suffix} │ │ │ │ ├── zzz{seg_map_suffix} │ │ │ ├── val
一个训练对将由 img_dir/ann_dir 里同样首缀的文件组成。
如果给定 split
参数,只有部分在 img_dir/ann_dir 里的文件会被加载。 我们可以对被包括在 split 文本里的文件指定前缀。
除此以外,一个 split 文本如下所示:
xxx zzz
只有
data/my_dataset/img_dir/train/xxx{img_suffix}
, data/my_dataset/img_dir/train/zzz{img_suffix}
, data/my_dataset/ann_dir/train/xxx{seg_map_suffix}
, data/my_dataset/ann_dir/train/zzz{seg_map_suffix}
将被加载。
注意:标注是跟图像同样的形状 (H, W),其中的像素值的范围是 [0, num_classes - 1]
。 您也可以使用 pillow 的 'P'
模式去创建包含颜色的标注。
参考: