VOC、YOLO、VIA、KITTI等数据标注格式解析

最新推荐文章于 2024-05-21 14:29:38 发布

ACE-Mayer

最新推荐文章于 2024-05-21 14:29:38 发布

阅读量3.1k

点赞数 4

分类专栏：计算机视觉机器学习文章标签：计算机视觉人工智能机器学习

本文链接：https://blog.csdn.net/sunmingyang1987/article/details/109230380

版权

机器学习同时被 2 个专栏收录

112 篇文章 7 订阅

订阅专栏

计算机视觉

79 篇文章 1 订阅

订阅专栏

VOC

VOC的全称是Visual Object Classes，第一届PASCAL VOC举办于2005年，然后每年一届，于2012年终止。
VOC标注文件是xml文件内容如下：

<?xml version="1.0" encoding="utf-8"?>
<annotation>
    <folder>VOC2007</folder>
    <filename>test100.mp4_3380.jpeg</filename>
    <size>
        <width>1280</width>
        <height>720</height>
        <depth>3</depth>
    </size>
    <object>
        <name>gemfield</name>
        <bndbox>
            <xmin>549</xmin>
            <xmax>715</xmax>
            <ymin>257</ymin>
            <ymax>289</ymax>
        </bndbox>
        <truncated>0</truncated>
        <difficult>0</difficult>
    </object>
    <object>
        <name>civilnet</name>
        <bndbox>
            <xmin>842</xmin>
            <xmax>1009</xmax>
            <ymin>138</ymin>
            <ymax>171</ymax>
        </bndbox>
        <truncated>0</truncated>
        <difficult>0</difficult>
    </object>
    <segmented>0</segmented>
</annotation>

举个带图的例子：
在这里插入图片描述

YOLO

YOLO是目标检测算法，其标注文件内容很简单，只有5列，分别是所标注内容的类别、归一化后的中心点x坐标，归一化后的中心点y坐标，归一化后的目标框宽度w，归一化后的目标况高度h（此处归一化指的是除以图片宽和高）
一个YOLO标注文件的内容如下所示：
在这里插入图片描述

VIA

VIA (VGG Image Annotator)是一款开源的图像标注工具，由Visual Geometry Group开发。可以在线和离线使用，可标注矩形、圆、椭圆、多边形、点和线。标注完成后，可以导出为csv和json文件格式。
其中导出的csv标注文件内容如下图所示：
在这里插入图片描述

KITTI

KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办，是目前国际上最大的自动驾驶场景下的算法评测数据集。该数据集用于评测立体图像(stereo)，光流(optical flow)，视觉测距(visual odometry)，3D物体检测(object detection)和3D跟踪(tracking)等计算机视觉技术在车载环境下的性能。
KITTI标注文件内容如下所示：
在这里插入图片描述

注意：
（1）’DontCare’ 标签表示该区域没有被标注，比如由于目标物体距离激光雷达太远。为了防止在评估过程中（主要是计算precision），将本来是目标物体但是因为某些原因而没有标注的区域统计为假阳性(false positives)，评估脚本会自动忽略’DontCare’ 区域的预测结果。
（2）如果是训练集，最后没有score这个参数。

ACE-Mayer

关注

4
点赞
踩
20

收藏

觉得还不错? 一键收藏
1
评论
VOC、YOLO、VIA、KITTI等数据标注格式解析

目录VOCYOLOVIAKITTIVOCVOC的全称是Visual Object Classes，第一届PASCAL VOC举办于2005年，然后每年一届，于2012年终止。VOC标注文件是xml文件内容如下：<?xml version="1.0" encoding="utf-8"?><annotation> <folder>VOC2007</folder> <filename>test100.mp4_3380.jpeg&
复制链接

扫一扫