DETR3D 开源项目使用教程
detr3d项目地址:https://gitcode.com/gh_mirrors/de/detr3d
1. 项目的目录结构及介绍
detr3d/
├── configs/
│ ├── default_runtime.py
│ ├── faster_rcnn_r50_fpn_1x.py
│ └── ...
├── detr3d/
│ ├── core/
│ ├── datasets/
│ ├── models/
│ ├── utils/
│ └── __init__.py
├── tools/
│ ├── train.py
│ ├── test.py
│ └── ...
├── README.md
└── setup.py
- configs/: 包含项目的配置文件,用于定义模型、数据集和训练参数。
- detr3d/: 项目的主要代码目录,包含核心功能、数据集处理、模型定义和工具函数。
- tools/: 包含训练和测试脚本,以及其他辅助工具。
- README.md: 项目说明文档。
- setup.py: 项目安装脚本。
2. 项目的启动文件介绍
训练脚本
# tools/train.py
import os
import argparse
from detr3d.utils.config import Config
from detr3d.train import train_model
def main():
parser = argparse.ArgumentParser(description="Train DETR3D model")
parser.add_argument("config", help="train config file path")
args = parser.parse_args()
cfg = Config.fromfile(args.config)
train_model(cfg)
if __name__ == "__main__":
main()
测试脚本
# tools/test.py
import os
import argparse
from detr3d.utils.config import Config
from detr3d.test import test_model
def main():
parser = argparse.ArgumentParser(description="Test DETR3D model")
parser.add_argument("config", help="test config file path")
args = parser.parse_args()
cfg = Config.fromfile(args.config)
test_model(cfg)
if __name__ == "__main__":
main()
3. 项目的配置文件介绍
默认运行时配置
# configs/default_runtime.py
_base_ = [
'../detr3d/configs/_base_/default_runtime.py'
]
# 模型配置
model = dict(
type='DETR3D',
backbone=dict(
type='ResNet',
depth=50,
num_stages=4,
out_indices=(0, 1, 2, 3),
frozen_stages=1,
norm_cfg=dict(type='BN', requires_grad=True),
norm_eval=True,
style='pytorch'),
neck=dict(
type='FPN',
in_channels=[256, 512, 1024, 2048],
out_channels=256,
num_outs=5),
bbox_head=dict(
type='DETR3DHead',
num_classes=80,
in_channels=256,
transformer=dict(
type='Transformer',
encoder=dict(
type='DetrTransformerEncoder',
num_layers=6,
transformerlayers=dict(
type='BaseTransformerLayer',
attn_cfgs=dict(
type='MultiheadAttention',
embed_dims=256,
num_heads=8,
dropout=0.1),
feedforward_channels=2048,
ffn_dropout=0.1,
operation_order=('self_attn', 'norm', 'ffn', 'norm'))),
decoder=dict(
type='DetrTransformerDecoder',
num_layers=6,
return_intermediate=True,
transformerlayers=dict(
type='BaseTransformerLayer',
attn_cfgs=dict(
type='MultiheadAttention',
embed_dims=256,
num_heads=8,
dropout=0.1),