我参加 NVIDIA Sky Hackathon---目标检测数据集转化篇

目录

数据集类型介绍

voc

coco

yolo

图像数据标注工具介绍

①labelimg

 ②labelme

③Coovally

④百度飞桨BMI

⑤GeoLabel


数据集类型介绍

voc

VOC 数据集由五个部分构成:JPEGImages,Annotations,ImageSets,SegmentationClass 以及 SegmentationObject.

  • JPEGImages:存放的是训练与测试的所有图片。
  • Annotations:里面存放的是每张图片打完标签所对应的 XML 文件。
  • ImageSets:ImageSets 文件夹下本次讨论的只有 Main 文件夹,此文件夹中存放的主要又有四个文本文件 test.txt、train.txt、trainval.txt、val.txt, 其中分别存放的是测试集图片的文件名、训练集图片的文件名、训练验证集图片的文件名、验证集图片的文件名。
  • SegmentationClass 与 SegmentationObject:存放的都是图片,且都是图像分割结果图,对目标检测任务来说没有用。class segmentation 标注出每一个像素的类别
  • object segmentation 标注出每一个像素属于哪一个物体。

voc 数据集的标签主要以 xml 文件形式进行存放。

xml 文件的标注格式如下:

<annotation>
  <folder>17</folder> # 图片所处文件夹
  <filename>77258.bmp</filename> # 图片名
  <path>~/frcnn-image/61/ADAS/image/frcnn-image/17/77258.bmp</path>
  <source>  #图片来源相关信息
    <database>Unknown</database>  
  </source>
  <size> #图片尺寸
    <width>640</width>
    <height>480</height>
    <depth>3</depth>
  </size>
  <segmented>0</segmented>  #是否有分割label
  <object> 包含的物体
    <name>car</name>  #物体类别
    <pose>Unspecified</pose>  #物体的姿态
    <truncated>0</truncated>  #物体是否被部分遮挡(>15%)
    <difficult>0</difficult>  #是否为难以辨识的物体, 主要指要结体背景才能判断出类别的物体。虽有标注, 但一般忽略这类物体
    <bndbox>  #物体的bound box
      <xmin>2</xmin>     #左
      <ymin>156</ymin>   #上
      <xmax>111</xmax>   #右
      <ymax>259</ymax>   #下
    </bndbox>
  </object>
</annotation>

coco

COCO 数据集现在有 3 种标注类型,分别是:

  • object instances(目标实例)
  • object keypoints(目标上的关键点)
  • image captions(看图说话)

这 3 种类型共享这些基本类型:info、image、license,使用 JSON 文件存储。

json 文件的标注格式如下:

以 Object Instance 为例,这种格式的文件从头至尾按照顺序分为以下段落:

{
    "info": info,               # dict
    "licenses": [license],      # list,内部是dict
    "images": [image],          # list,内部是dict
    "annotations": [annotation],# list,内部是dict
    "categories": [category]    # list,内部是dict
}

info{                           # 数据集信息描述
    "year": int,                # 数据集年份
    "version": str,             # 数据集版本
    "description": str,         # 数据集描述
    "contributor": str,         # 数据集提供者
    "url": str,                 # 数据集下载链接
    "date_created": datetime,   # 数据集创建日期
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Data Hackathon 3.x是一种数据驱动型的编程比赛,旨在为参赛者提供一个展示他们在数据分析和机器学习方面技能的平台。这个比赛涉及到大量的数据处理和建模任务,参赛者需要利用给定的数据集来开发和优化模型,以解决一个特定的问题或挑战。 Data Hackathon 3.x的目的是通过实践应用数据科学的技术和方法,提供一个学习和提升技能的机会。参赛者将会面对真实世界的数据,并通过分析、探索和挖掘数据来获得洞见。他们需要运用统计学、机器学习和数据可视化等技术工具,来解决给定的问题,并建立一个有用的模型。 在比赛中,参赛者需要展示他们在数据处理和分析方面的能力,包括数据清洗、特征选择、特征工程和模型评估等。他们还需要有效地使用统计和机器学习算法,以及开发和优化模型的技巧。 比赛通常会设定一定的时间限制,以模拟现实世界中的挑战。参赛者需要在有限的时间内快速迭代和改进他们的模型,以获得更好的性能和结果。 Data Hackathon 3.x是一个创新和协作的过程,参赛者可以借此与其他数据科学家和专家进行互动,分享和学习最佳实践,拓宽自己的视野。 在这个比赛中,数据科学家们有机会展示他们的技术和创造力,在解决现实问题方面产生积极的影响。通过参与Data Hackathon 3.x,他们可以提高自己在数据分析和机器学习领域的技能,并有机会获取奖励和认可。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值