MMDetection 训练无人机目标检测VisDrone数据集记录

开始学AI

已于 2023-03-06 11:55:52 修改

阅读量1.5k

点赞数 4

分类专栏：从零开始学目标检测文章标签：目标检测计算机视觉深度学习

于 2021-12-03 10:27:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41964545/article/details/121690778

版权

从零开始学目标检测专栏收录该内容

1 篇文章 1 订阅

订阅专栏

目录

1 数据集标签转化

MMDetection目标检测框架采用的数据集格式是COCO格式，为了采用COCODataset 类来加载数据并进行训练以及评测，需要将VisDrone数据集转换为COCO格式，可参考VisDrone数据集转COCO格式数据集

1.1 COCO数据集格式介绍

MS COCO 是google 开源的大型数据集，分为目标检测、分割、关键点检测三大任务，数据集主要由图片和json 标签文件组成。对于目标检测，json文件的格式主要如下：
在这里插入图片描述
其中共包括6个字段，实际应用中，info和license字段用不上。
对于本实验转化后的数据集包括4个字段

images字段又包括4项字段

filename：图片名
height：高
width：宽
id

其中最重要的是id字段，代表的是图片的id，每一张图片具有唯一的一个独特的id。

annotations字段包含多个annotation实例的一个列表，annotation类型本身又包含了一系列的字段，如这个目标的category id和segmentation mask。segmentation格式取决于这个实例是一个单个的对象（即iscrowd=0，将使用polygons格式）还是一组对象（即iscrowd=1，将使用RLE格式）
在这里插入图片描述

id字段：指的是这个annotation的一个id
image_id：等同于前面image字段里面的id。
category_id：类别id
segmentation：用于分割
area：标注区域面积
bbox：标注框，左上角坐标标注框宽和高
iscrowd：决定是RLE格式还是polygon格式。

categories字段的id数，就是类别数。在这里插入图片描述

id：类别id
name：类别id对应的名字

参考链接：COCO数据集介绍

1.2 上传数据集并解压

已按照前文进行了标签转化，前文已在矩池云配置了MMDetection，为了实现在训练，将处理好的数据集上传。
在这里插入图片描述

上传过程漫长，还是本地实验最舒服，好想拥有一块3090呀！

MMDetection 训练

解压文件，需要等待片刻

cd /mnt/MMDetection/mmdetection/Datasets
unzip VisDrone.zip

进入到工作目录

cd /mnt/MMDetection/mmdetection

选择模型以及调整配置文件，在configs文件夹下新建文件my_custom_config.py

在这里插入代码片

关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
MMDetection 训练无人机目标检测VisDrone数据集记录

矩池云配置MMDetection实现目标检测训练
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

开始学AI 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。