VOC数据集 XML 和 txt标注文本的理解

VOC数据集 XML 和 txt标注文本的理解

以VOC数据集中VOC2007中的000001.jpg图片为例,分析下其对应的Annotations文件夹下的000001.xml文件和labels文件夹下的000001.txt文件

在这里插入图片描述

整幅图片的尺寸为
宽353,高500.

XML文件中:

353*500 是这张000001.jpg图片的宽和高object狗在图片中左上角坐标为(48,240),右下角坐标为(195,371)object人在图片中左上角坐标为(8,12),右下角坐标为(352,498)

在voc.name文件中:

object狗所在的ID为11;
object人所在的ID为14;

txt文件中:

类别一

11 0.341359773371 0.609 0.416430594901 0.262

其中,
11是【 ID】:object狗,

0.341359773371 :【中心点X的比例标注】,353*0.341359773371 = 120.5 pixel, 约等于图像中的直接计算值:(195-48)/2 + 48 = 121.5

0.609 :【中心点Y的比例标注】 500*0.609=304.5, 约等于图像中的直接计算值: (371-240)/2 + 240 = 305.5

0.416430594901: 【BOX宽比例标注】(195-48)/353 = 0.4164

0.262: 【BOX高比例标注】(371-240)/500 = 0.262

类别二

14 0.507082152975 0.508 0.974504249292 0.972

14是 【ID】:object人
后面四个数值代表的意义与计算方式同上,依次是
【中心点X的比例标注】
【中心点Y的比例标注】
【BOX宽比例标注】
【BOX高比例标注】

  • 7
    点赞
  • 40
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值