mmrotate旋转目标检测框架从环境配置到训练自己的数据集

mmrotate旋转目标检测框架从环境配置到训练自己的数据集

最近有旋转目标检测的需求了,在寻找旋转目标检测算法的过程中,发现已经有人提前测评了各类旋转目标检测框架了,结果是mmrorate效果最好。本次记录一下mmrorate的实验过程。
将持续更新实验记录!
主要参考:
1.测评参考:

https://blog.csdn.net/FL1623863129/article/details/123408354?utm_medium=distribute.pc_relevant.none-task-blog-2defaultbaidujs_title~default-4-123408354-blog-124335060.pc_relevant_multi_platform_whitelistv1&spm=1001.2101.3001.4242.3&utm_relevant_index=7

2.实现过程参考

https://blog.csdn.net/Sylvia_Lan/article/details/124008837
https://github.com/open-mmlab/mmrotate
https://sxj731533730.blog.csdn.net/article/details/124107625?spm=1001.2101.3001.6650.4&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-4-124107625-blog-124008837.pc_relevant_default&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-4-124107625-blog-124008837.pc_relevant_default&utm_relevant_index=6
https://blog.csdn.net/qq_43581224/article/details/123838415

一、配置环境

1.目前电脑已有环境
(1)Ubuntu20.04
(2)Cuda==11.2+cudnn
2.下载代码建立虚拟环境
(1)下载代码

https://github.com/open-mmlab/mmrotate

(2)建立虚拟环境
用pycharm打开该代码文件夹,并添加虚拟环境
在这里插入图片描述
(3)安装pytorch
进入pytorch官网,找到适合自己的版本,进行下载安装。
注:如果有小伙伴和我一样安装的是Cuda11.2,在pytorch官网上,无法找到对应版本时,可是试着安装cuda11.3对应的pytorch==1.11.0版本。
(4)安装mmrorate

pip install openmim
mim install mmrotate

二、测试

1.下载权重
权重模型集合

https://download.openmmlab.com/mmrotate/v0.1.0/kfiou/r3det_kfiou_ln_r50_fpn_1x_dota_oc/r3det_kfiou_ln_r50_fpn_1x_dota_oc-8e7f049d.pth

下载后,在mmrorate文件夹下,新建model文件夹,并放入model文件夹中。
在这里插入图片描述
2.运行demo
运行指令格式:

python demo/image_demo.py \
    ${IMG_ROOT} \
    ${CONFIG_FILE} \
    ${CHECKPOINT_FILE}

IMG_ROOT:为待检测图像
CONFIG_FILE:为配置文件
CHECKPOINT_FILE:为训练好的权重。

pycharm终端cd道demo文件夹,输入

python3 image_demo.py demo.jpg ../configs/kfiou/r3det_kfiou_ln_r50_fpn_1x_dota_oc.py ../model/r3det_kfiou_ln_r50_fpn_1x_dota_oc-8e7f049d.pth

在这里插入图片描述
至此,可以确定整体环境没问题了。
3.调试demo
不怎么喜欢用命令执行代码,因此修改image_demo.py文件。
在这里插入图片描述
注意:img、config和checkpoint前面需要加上"–",否则无法正常加载参数。

三、制作自己的数据集

1.安装rolabelimg标注工具
参考:

https://blog.csdn.net/qq_41672428/article/details/107690102
在win下进行安装会比较容易。

遇到的问题
1.pyrcc5 -o resources.py resources.qrc ‘pyrcc5’ 不是内部或外部命令,也不是可运行的程序或批处理文件。
解决方法:
cmd中输入:

python
import sys
print(sys.path)

在这里插入图片描述
找到python安装路径,进入该目录下,寻找pyrcc5.exe文件,或者直接文件夹上面寻找pyrcc5.exe文件,找到后,复制到labelImg文件夹中。
2.格式转换
参考:

https://blog.csdn.net/qq_43581224/article/details/123838415

转换成功后,在对应输出文件夹下,会生成如下文件。
在这里插入图片描述

四、训练自己的数据集

1.配置train.py
在这里插入图片描述
主要配置–config和–work-dir两个。其中–config为训练配置文件,–work-dir为模型和日志保存文件夹。
2.修改配置文件
这里我选用的是r3det_r50_fpn_1x_dota_oc.py,实际应用中,根据你选择的去修改。
1)r3det_r50_fpn_1x_dota_oc.py
这里修改为你自己的类别数量,我的是1,num_classes=1。
在这里插入图片描述
2)mmrotate/mmrotate/datasets/dota.py
修改类别名字,注意后面的逗号需要保留。
在这里插入图片描述
3)mmrotate/configs/base/datasets/dotav1.py
第一步修改:data_root = 'data/split_1024_dota1_0/'为自己的文件夹。该文件夹需要包括train、trainval、test三个文件夹,三个文件夹内部再新建annfiles和images文件夹,并放入之前生成的数据。
在这里插入图片描述

第二步:修改train=dict这一栏
在这里插入图片描述
修改代码如下:

# dataset settings
dataset_type = 'DOTADataset'
data_root = '/home/cj/work/code/python/mmrotate/mydata/'
img_norm_cfg = dict(
    mean=[123.675, 116.28, 103.53], std=[58.395, 57.12, 57.375], to_rgb=True)
train_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(type='LoadAnnotations', with_bbox=True),
    dict(type='RResize', img_scale=(1024, 1024)),
    dict(type='RRandomFlip', flip_ratio=0.5),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='Pad', size_divisor=32),
    dict(type='DefaultFormatBundle'),
    dict(type='Collect', keys=['img', 'gt_bboxes', 'gt_labels'])
]
test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='MultiScaleFlipAug',
        img_scale=(1024, 1024),
        flip=False,
        transforms=[
            dict(type='RResize'),
            dict(type='Normalize', **img_norm_cfg),
            dict(type='Pad', size_divisor=32),
            dict(type='DefaultFormatBundle'),
            dict(type='Collect', keys=['img'])
        ])
]
data = dict(
    samples_per_gpu=2,
    workers_per_gpu=2,
    train=dict(
        type=dataset_type,
        ann_file=data_root + 'train/annfiles/',
        img_prefix=data_root + 'train/images/',
        pipeline=train_pipeline),
    val=dict(
        type=dataset_type,
        ann_file=data_root + 'trainval/annfiles/',
        img_prefix=data_root + 'trainval/images/',
        pipeline=test_pipeline),
    test=dict(
        type=dataset_type,
        ann_file=data_root + 'test/annfiles/',
        img_prefix=data_root + 'test/images/',
        pipeline=test_pipeline))

此时已经可以训练了,但还可以修改其他的训练参数。
4)configs/base/schedules/schedule_1x.py

# evaluation
evaluation = dict(interval=5, metric='mAP')  # 训练多少轮评估一次
# optimizer
optimizer = dict(type='SGD', lr=0.0025, momentum=0.9, weight_decay=0.0001)
optimizer_config = dict(grad_clip=dict(max_norm=35, norm_type=2))
# learning policy
lr_config = dict(
    policy='step',
    warmup='linear',
    warmup_iters=500,
    warmup_ratio=1.0 / 3,
    step=[8, 11])
runner = dict(type='EpochBasedRunner', max_epochs=100)  # 训练的总次数
checkpoint_config = dict(interval=10)  # 训练多少次后保存模型

5)configs/base/default_runtime.py


# yapf:disable
log_config = dict(
    interval=50,  # 训练多少iter后打印输出训练日志
    hooks=[
        dict(type='TextLoggerHook'),
        # dict(type='TensorboardLoggerHook')
    ])

在这里插入图片描述
3.测试
demo/image_demo.py修改–checkpoint为自己训练好的模型。
在这里插入图片描述

  • 8
    点赞
  • 58
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 12
    评论
Transformer发轫于NLP(自然语言处理),并跨界应用到CV(计算机视觉)领域。 Swin Transformer是基于Transformer的计算机视觉骨干网,在图像分类、目标检测、实例分割、语义分割等多项下游CV应用中取得了SOTA的性能。该项工作也获得了ICCV 2021顶会最佳论文奖。本课程将手把手地教大家使用labelme标注和使用Swin Transformer训练自己的数据集进行图片和视频的实例分割。  本课程将介绍Transformer及在CV领域的应用、Swin Transformer的原理。 本课程以汽车驾驶场景图片和视频开展项目实践:对汽车行驶场景中的路坑、车、车道线进行物体标注和实例分割。  课程在Windows和Ubuntu系统上分别做项目演示。包括:安装软件环境、安装Pytorch、安装Swin-Transformer-Object-Detection、标注自己的数据集、准备自己的数据集数据集格式转换(Python脚本完成)、修改配置文件、训练自己的数据集、测试训练出的网络模型、性能统计、日志分析。  本课程提供项目的数据集和相关Python程序文件。相关课程: 《Transformer原理与代码精讲(PyTorch)》https://edu.csdn.net/course/detail/36697《Transformer原理与代码精讲(TensorFlow)》https://edu.csdn.net/course/detail/36699《ViT(Vision Transformer)原理与代码精讲》https://edu.csdn.net/course/detail/36719《DETR原理与代码精讲》https://edu.csdn.net/course/detail/36768《Swin Transformer实战目标检测训练自己的数据集》https://edu.csdn.net/course/detail/36585《Swin Transformer实战实例分割:训练自己的数据集》https://edu.csdn.net/course/detail/36586《Swin Transformer原理与代码精讲》 https://download.csdn.net/course/detail/37045

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小俊俊的博客

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值