mmrotate旋转目标检测框架从环境配置到训练自己的数据集

小俊俊的博客

已于 2022-08-02 10:27:56 修改

阅读量5.2k

点赞数 8

分类专栏： work 文章标签：目标检测 python 人工智能

于 2022-07-01 15:33:05 首次发布

本文链接：https://blog.csdn.net/weixin_41868104/article/details/125557687

版权

work 专栏收录该内容

18 篇文章

订阅专栏

mmrotate旋转目标检测框架从环境配置到训练自己的数据集

最近有旋转目标检测的需求了，在寻找旋转目标检测算法的过程中，发现已经有人提前测评了各类旋转目标检测框架了，结果是mmrorate效果最好。本次记录一下mmrorate的实验过程。
将持续更新实验记录！
主要参考：
1.测评参考：

https://blog.csdn.net/FL1623863129/article/details/123408354?utm_medium=distribute.pc_relevant.none-task-blog-2_defaultbaidujs_title~default-4-123408354-blog-124335060.pc_relevant_multi_platform_whitelistv1&spm=1001.2101.3001.4242.3&utm_relevant_index=7

2.实现过程参考

https://blog.csdn.net/Sylvia_Lan/article/details/124008837
https://github.com/open-mmlab/mmrotate
https://sxj731533730.blog.csdn.net/article/details/124107625?spm=1001.2101.3001.6650.4&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-4-124107625-blog-124008837.pc_relevant_default&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-4-124107625-blog-124008837.pc_relevant_default&utm_relevant_index=6
https://blog.csdn.net/qq_43581224/article/details/123838415

一、配置环境

1.目前电脑已有环境
（1）Ubuntu20.04
（2）Cuda==11.2+cudnn
2.下载代码建立虚拟环境
（1）下载代码

https://github.com/open-mmlab/mmrotate

（2）建立虚拟环境
用pycharm打开该代码文件夹，并添加虚拟环境
在这里插入图片描述
（3）安装pytorch
进入pytorch官网，找到适合自己的版本，进行下载安装。
注：如果有小伙伴和我一样安装的是Cuda11.2，在pytorch官网上，无法找到对应版本时，可是试着安装cuda11.3对应的pytorch==1.11.0版本。
(4)安装mmrorate

pip install openmim
mim install mmrotate

二、测试

1.下载权重
权重模型集合

https://download.openmmlab.com/mmrotate/v0.1.0/kfiou/r3det_kfiou_ln_r50_fpn_1x_dota_oc/r3det_kfiou_ln_r50_fpn_1x_dota_oc-8e7f049d.pth

下载后，在mmrorate文件夹下，新建model文件夹，并放入model文件夹中。
在这里插入图片描述
2.运行demo
运行指令格式：

python demo/image_demo.py \
    ${IMG_ROOT} \
    ${CONFIG_FILE} \
    ${CHECKPOINT_FILE}

IMG_ROOT：为待检测图像
CONFIG_FILE：为配置文件
CHECKPOINT_FILE：为训练好的权重。

pycharm终端cd道demo文件夹，输入

python3 image_demo.py demo.jpg ../configs/kfiou/r3det_kfiou_ln_r50_fpn_1x_dota_oc.py ../model/r3det_kfiou_ln_r50_fpn_1x_dota_oc-8e7f049d.pth

在这里插入图片描述
至此，可以确定整体环境没问题了。
3.调试demo
不怎么喜欢用命令执行代码，因此修改image_demo.py文件。

注意：img、config和checkpoint前面需要加上"–"，否则无法正常加载参数。

三、制作自己的数据集

1.安装rolabelimg标注工具
参考：

https://blog.csdn.net/qq_41672428/article/details/107690102
在win下进行安装会比较容易。

遇到的问题
1.pyrcc5 -o resources.py resources.qrc ‘pyrcc5’ 不是内部或外部命令，也不是可运行的程序或批处理文件。
解决方法：
cmd中输入：

python
import sys
print(sys.path)

在这里插入图片描述
找到python安装路径，进入该目录下，寻找pyrcc5.exe文件，或者直接文件夹上面寻找pyrcc5.exe文件，找到后，复制到labelImg文件夹中。
2.格式转换
参考：

https://blog.csdn.net/qq_43581224/article/details/123838415

转换成功后，在对应输出文件夹下，会生成如下文件。
在这里插入图片描述

四、训练自己的数据集

1.配置train.py
在这里插入图片描述
主要配置–config和–work-dir两个。其中–config为训练配置文件，–work-dir为模型和日志保存文件夹。
2.修改配置文件
这里我选用的是r3det_r50_fpn_1x_dota_oc.py，实际应用中，根据你选择的去修改。
1）r3det_r50_fpn_1x_dota_oc.py
这里修改为你自己的类别数量，我的是1，num_classes=1。
在这里插入图片描述
2）mmrotate/mmrotate/datasets/dota.py
修改类别名字，注意后面的逗号需要保留。

3）mmrotate/configs/base/datasets/dotav1.py
第一步修改：data_root = 'data/split_1024_dota1_0/'为自己的文件夹。该文件夹需要包括train、trainval、test三个文件夹,三个文件夹内部再新建annfiles和images文件夹，并放入之前生成的数据。
在这里插入图片描述

第二步：修改train=dict这一栏
在这里插入图片描述
修改代码如下：

# dataset settings
dataset_type = 'DOTADataset'
data_root = '/home/cj/work/code/python/mmrotate/mydata/'
img_norm_cfg = dict(
    mean=[123.675, 116.28, 103.53], std=[58.395, 57.12, 57.375], to_rgb=True)
train_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(type='LoadAnnotations', with_bbox=True),
    dict(type='RResize', img_scale=(1024, 1024)),
    dict(type='RRandomFlip', flip_ratio=0.5),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='Pad', size_divisor=32),
    dict(type='DefaultFormatBundle'),
    dict(type='Collect', keys=['img', 'gt_bboxes', 'gt_labels'])
]
test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='MultiScaleFlipAug',
        img_scale=(1024, 1024),
        flip=False,
        transforms=[
            dict(type='RResize'),
            dict(type='Normalize', **img_norm_cfg),
            dict(type='Pad', size_divisor=32),
            dict(type='DefaultFormatBundle'),
            dict(type='Collect', keys=['img'])
        ])
]
data = dict(
    samples_per_gpu=2,
    workers_per_gpu=2,
    train=dict(
        type=dataset_type,
        ann_file=data_root + 'train/annfiles/',
        img_prefix=data_root + 'train/images/',
        pipeline=train_pipeline),
    val=dict(
        type=dataset_type,
        ann_file=data_root + 'trainval/annfiles/',
        img_prefix=data_root + 'trainval/images/',
        pipeline=test_pipeline),
    test=dict(
        type=dataset_type,
        ann_file=data_root + 'test/annfiles/',
        img_prefix=data_root + 'test/images/',
        pipeline=test_pipeline))

此时已经可以训练了，但还可以修改其他的训练参数。
4）configs/base/schedules/schedule_1x.py

# evaluation
evaluation = dict(interval=5, metric='mAP')  # 训练多少轮评估一次
# optimizer
optimizer = dict(type='SGD', lr=0.0025, momentum=0.9, weight_decay=0.0001)
optimizer_config = dict(grad_clip=dict(max_norm=35, norm_type=2))
# learning policy
lr_config = dict(
    policy='step',
    warmup='linear',
    warmup_iters=500,
    warmup_ratio=1.0 / 3,
    step=[8, 11])
runner = dict(type='EpochBasedRunner', max_epochs=100)  # 训练的总次数
checkpoint_config = dict(interval=10)  # 训练多少次后保存模型

5）configs/base/default_runtime.py


# yapf:disable
log_config = dict(
    interval=50,  # 训练多少iter后打印输出训练日志
    hooks=[
        dict(type='TextLoggerHook'),
        # dict(type='TensorboardLoggerHook')
    ])