【模型复现】自制数据集上复现目标检测域自适应 Towards Online Domain Adaption Object Decetion 代码 online-da

果果粒粒

已于 2024-02-26 15:11:00 修改

阅读量1.1k

点赞数 21

分类专栏：深度学习问题记录文章标签：目标检测深度学习

于 2024-02-21 16:17:11 首次发布

本文链接：https://blog.csdn.net/Mecaly/article/details/136210650

版权

深度学习同时被 2 个专栏收录

11 篇文章 4 订阅

订阅专栏

问题记录

11 篇文章 0 订阅

订阅专栏

【模型复现】自制数据集上复现目标检测域自适应 Towards Online Domain Adaption Object Decetion 代码 online-da

1. 环境安装
- 1.1 要求
- 1.2 安装
2. 数据准备
3. 模型复现
4. 踩坑记录

Code：online-da
Paper：Towards Online Domain Adaption Object Decetion

1. 环境安装

1.1 要求

Linux 上 Python ≥ 3.7
PyTorch ≥ 1.8，torchvision 必须和安装的 PyTorch匹配
gcc & g++ ≥ 5.4

1.2 安装

# 创建环境
conda create -n online_da python=3.7

# 激活环境
conda activate online_da

# torch 安装
# 本机 CUDA 为 11.8，根据代码 README.md 安装环境后版本不匹配，故安装了符合要求的 pytorch==1.10，这里需要自行根据 CUDA 版本安装适配的 torch 版本
conda install pytorch==1.10.1 torchvision==0.11.2 torchaudio==0.10.1 cudatoolkit=11.3 -c pytorch -c conda-forge

# pip 包
cd online-da
pip install -r requirements.txt

# pip detectron2 相关包
cd ..
python -m pip install -e online-da

2. 数据准备

准备 coco 格式的训练数据，数据集的文件结构为：

my_datasets/
├──annotations
│	├──train.json
│	└──val.json
├──train
│	├──xxx.jpg
│	├──xxx.jpg
│	└──xxx.jpg
└──val
	├──xxx.jpg
	├──xxx.jpg
	└──xxx.jpg

3. 模型复现

3.1 数据集注册

修改 online-da-main/detectron2/data/datasets/builtin.py
- 如下图所示添加自制数据集
- 如下图所示修改加载数据路径
修改 online-da-main/detectron2/data/datasets/builtin_meta.py
- 如下图所示添加代码并根据需要进行修改
- 同时在 _get_builtin_metadata() 函数中将 coco 格式的返回值修改为上述添加的 _get_smoke_coco_meta() 即可。

3.2 超参数配置

超参数配置文件修改
- 在 configs/online-da/ 路径下新建 onda_my_datasets.yaml，根据需要进行超参数修改，示例如下：
预训练权重下载
- 链接: 预训练权重下载地址
- 从上述链接中下载所需预训练权重，并放至项目根目录下
超参数配置
- 文件路径 online-da/detectron2/engine/defaults.py
- 配置 config-file 为第一步修改的 onda_my_datasets.yaml 文件路径
- 配置 model-dir 为第二步下载的权重 model_final.pth 路径
- 根据需要进行 num-gpus 配置

3.3 模型训练

在终端中使用 python tools/train_onlineda_net.py 即可进行模型训练

4. 踩坑记录

4.1 报错：AssertionError: Attribute ‘thing_dataset_id_to_contiguous_id’ in the metadata of ‘coco_smoke_val’ cannot be set to a different value! {1: 0, 2: 1, 3: 2, 4: 3} != {0: 0, 1: 1, 2: 2, 3: 3}

在这里插入图片描述

原因分析
- 在注册数据集时，标签的 id 序号从 1 开始，而数据集的 json 文件中从 0 开始，导致标签序号不匹配
解决方法
- 注册数据集时，将 id 序号修改为从 0 开始

4.2 报错：KeyError: ‘image_weak’

在这里插入图片描述

问题分析
- 变量 x 中不存在名为 ‘image_weak’ 的 key 值
解决方法
- 选择合适的模型或者以 onda 开头的 yaml 文件

4.3 报错：Exception: backbone.stem.conv1.weight is not found in student model

问题分析
- 在 student 模型中没有权重值 backbone.stem.conv1.weight，在 tools/train_onlineda_net.py 的 update_teacher_model() 函数中权重值字典中 key 值从第 7 个字符开始，导致 student 和 teacher 模型的权重值名称不匹配
解决方法
- 修改 key 值为权重值名称全称

4.4 报错：AttributeError: InstanceAnnotation

在这里插入图片描述

问题分析
- 缺少 detectron2._C 模块，导致无法调用 _C.InstanceAnnotation
解决方法
- 按照环境安装步骤重新安装环境

4.5 报错：error: package directory ‘projects/PointRend/point_rend’ does not exist

在这里插入图片描述

问题分析
- 缺少 projects 文件夹
解决方法
- online-da 代码基于 detectron2 框架，故从 detectron2 官方代码中复制 projects 文件夹到 online-da 根目录下即可

4.6 报错：unhandled cuda error

在这里插入图片描述

问题分析
- 安装环境版本间不兼容
解决方法
- 按照环境安装步骤重新安装环境

4.7 报错：KeyError：‘class-AP50’

在这里插入图片描述

问题分析
- results_i['bbox'] 中无 key 值 ’class-AP50'
解决方法
- 首先查看 results_i['bbox'] 内容
- 可看到 results_i['bbox'] 中并不存在名称为 ’class-AP50' 的 key 值，并且报错位置的代码实现功能为记录每个类别的 AP 值，故修改代码对各类别的 AP 进行输出即可