目标检测数据集分析

原文链接:https://ghlcode.cn/pages/250d97

目标检测数据集分析

📢 新增支持数据集可视化,Ghlerrix/DataAnalyze

平时我们经常需要对我们的数据集进行各种分析,以便我们找到更好的提高方式。所以我将我平时分析数据集的一些方法打包发布在了Github上,分享给大家,有什么错误和意见,请多多指教!

项目地址

https://github.com/Ghlerrix/DataAnalyze

图片数量、标注框数量、类别信息

这些信息会在终端打印出来,格式如下:

Parsing dataset, please wait...
Parsing done. (0.013s)

number of images: 1266
number of annotations: 2950
number of categories: 6
names of categories:  ['inclusion', 'rolled-in_scale', 'pitted_surface', 'patches', 'crazing', 'scratches']

所有图片宽度和高度的散点图

这里只有一个点,是因为所有的图片尺寸相同

https://fastly.jsdelivr.net/gh/Ghlerrix/ImageHosting/img/image-20230724135917043.png

所有标注框宽度和高度的散点图

https://fastly.jsdelivr.net/gh/Ghlerrix/ImageHosting/img/image-20230724135938272.png

标注框宽度和高度之比 横坐标为比率,纵坐标为数量

https://fastly.jsdelivr.net/gh/Ghlerrix/ImageHosting/img/image-20230724142948691.png

每一类的标注框数量

https://fastly.jsdelivr.net/gh/Ghlerrix/ImageHosting/img/image-20230724133028407.png

https://fastly.jsdelivr.net/gh/Ghlerrix/ImageHosting/img/image-20230724133043677.png

每一类图片数量

https://fastly.jsdelivr.net/gh/Ghlerrix/ImageHosting/img/image-20230724133120693.png

https://fastly.jsdelivr.net/gh/Ghlerrix/ImageHosting/img/image-20230724133238728.png

每一张图片上的标注框数量

横坐标为一张图片上的标注框数量,纵坐标为图片数量

https://fastly.jsdelivr.net/gh/Ghlerrix/ImageHosting/img/image-20230724133318433.png

不同尺寸的图片数量

根据coco的划分规则计算

https://fastly.jsdelivr.net/gh/Ghlerrix/ImageHosting/img/image-20230724140109094.png

https://fastly.jsdelivr.net/gh/Ghlerrix/ImageHosting/img/image-20230724140052480.png

使用方法

Ghlerrix/DataAnalyze: Object-detection dataset analyze (github.com)

Install

git clone https://github.com/Ghlerrix/DataAnalyze.gitcd DataAnalyzepip install -r requirements.txt

Usage

python analyze.py ${type} ${path} [--out ${out}]
  • type The format of the dataset, optional ‘coco’ or ‘voc’.
  • path The path of dataset. If type is ‘coco’, the path is the json file path. If type is ‘voc’, the path is the path of the xml file directory.
  • -out is the output directory, default is ‘./out’

Example

python analyze.py coco ./tarin.json --out ./out/
python analyze.py voc ./xml/ --out ./out/
  • 13
    点赞
  • 67
    收藏
    觉得还不错? 一键收藏
  • 26
    评论
### 回答1: 目标检测数据集是计算机视觉领域中一类非常重要的数据集。它包含大量不同种类的图像,这些图像中存在需要被识别出来的目标,并且每个目标都会进行标注,以便于后续的算法训练和测试。csdn是一个比较知名的技术交流社区,提供了许多有关计算机视觉和深度学习相关的数据集,包括目标检测数据集。 csdn上的目标检测数据集包含了许多不同种类的数据集,包括COCO、PASCAL VOC、ImageNet等。COCO数据集是当前最著名的目标检测数据集之一,它包含了超过33万张高分辨率的图像,同时还提供了丰富的物体注释信息,包括80个不同类别的物体及其位置和大小等信息。PASCAL VOC数据集也是一种经典的目标检测数据集,它涵盖了20种不同类别的物体目标,提供了大量的图像和标注信息,被广泛应用于计算机视觉领域的研究和应用中。 使用csdn提供的目标检测数据集,研究者和开发人员可以利用这些数据进行算法训练和测试,并通过不断地迭代来提高算法的性能和准确性,进而应用到更加广泛的场景中,如无人驾驶、安防监控等领域。同时,对于初学者来说,这些数据集也可以用来学习基本的目标检测算法和技巧,提高自己的技能和能力。 ### 回答2: 目标检测数据集是用于训练和测试计算机视觉算法的集合。它们通常包含大量带有标记的图像,其中每个对象都已经被定位和标记。这些数据集可用于训练与目标检测相关的深度学习模型,包括卷积神经网络(CNN)、循环神经网络(RNN)等。 目标检测数据集的CSND是一个公开的、包含多种不同类型数据集的平台。这些数据集主要分为以下几类:检测、分割、分类、行人重识别、场景分析等。其中最受欢迎的包括PASCAL VOCCOCO,Object Detection from Video(ImageNet VID),ImageNet DET和MS COCO等。 PASCAL VOC是一个主要用于物体识别和检测的数据集,提供了2007年至2012年期间收集的图像,并注释了20种常见物体的位置。COCOCOCO数据集的简称,是目前最流行的目标检测数据集之一,其包含超过328,000张图像和2.5万个对象标注,用于训练物体检测、图像分割和关键点检测模型。 ImageNet因其规模之大而备受关注,它包含超过1400万张图像和超过2万个类别标注,通常用于对图像分类和物体检测的算法进行预训练。MS COCO是一个新兴的数据集,囊括了更多有挑战性的任务,包括图像描述、姿态估计和密集预测等。 总之,目标检测数据集是深度学习计算机视觉领域中的重要资源,不同数据集包含不同的样本规模、数据质量和任务难度,可以帮助研究人员和工程师更好地了解物体检测算法的性能和应用场景。CSND作为一个公开、多样化的数据集平台,方便开发者在算法优化及模型测试期间进行使用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 26
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值