【数据标注】数据集标注规范与常见情况

本文创作目的是指导实验室参赛队员进行数据集标注。同时也欢迎路人围观。

1. 开始

  1. 首先选择标注格式为yolo格式。不要选择错成VOC等其他格式了。
  2. 勾选View惨淡下的Auto Save Mode和Single Class Mode(单标签模式)。
  3. 选择好你的图片文件夹路径和保存路径。

2. 正常标注

我们的标注会分为两种情况,瞄准和取环。一般情况下,我们用最小外接矩形框住目标物体就可以。当目标较小时,可以放大来标,一定要保证标注准确

标注好第一个标签。如果是柱子就只命名为pvc,如果是环就只命名为cirque。同种视角下的所有的标签都命名为同一个,不要出现1 2 3……等情况。(注:环只在取环视角下要标注。瞄准的摄像头视角下只要标注立柱即可)

最后,我们会在你所选的保存路径下形成一批.txt文件。将其打包提交即可。

2.1 正确示范

2.1.1 标注

正确示范

2.1.2 数据

在这里插入图片描述

2.2 错误示范

2.2.1 标注

以下错误原因均为没有使用最小外接矩形框住目标:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.2.2 数据

这里是因为按照 1 2 3 4 5 来命名标签了。
在这里插入图片描述

3. 常见特别情况

3.1 遮挡情况

我们希望计算机认识什么,就标注什么给它学习。众所周知,摄像头不会透视。在遮挡情况下,我们需要酌情处理。当遮挡较多时,只标注露出来的部分即可,不要多标;在露出部分较多时,依然需要将整块目标标注上。

3.1.1 正确示范

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.1.2 错误示范

错误原因为露出部分较少,但是把整块都标注了。在这里插入图片描述

3.2 边缘情况

在这种情况下,我们依然需要酌情处理。露出较少时就忽略,露出较多时就标注上。

3.2.1 正确示范

标注:在这里插入图片描述
在这里插入图片描述
忽略:
在这里插入图片描述

3.2.2 特殊情况

当标注取环视角时,有露出部分就要标注:在这里插入图片描述

3.3 无目标情况

这种情况下我们不能直接跳过,而应该随便拉一个标注框然后再将其删除,这样labelImg会创建一个空的txt文件,编号是依然是连续的。如果直接跳过,编号就会间断,不方便后期操作数据集。
在这里插入图片描述
以上为标注规范和注意事项。如有其他本文未涵盖的情况直接问我就行。

知识图谱数据集标注是构建和完善知识图谱的重要步骤,需要关注以下注意事项: 1. 数据质量保证:标注人员需要具备一定的专业知识和经验,以准确理解和标注数据。同时,应对标注结果进行严格的质量控制和评估,确保标注结果的准确性和一致性。 2. 标注规范统一:制定标注规范是必要的,要对实体和关系进行明确定义,并提供具体的标注示范和说明,以保证标注一致性和可比性。 3. 审核和纠错机制:设立审核和纠错机制,通过多人标注和审查,发现和纠正标注错误,提高数据集的质量。 4. 标注工具选择:选择合适的标注工具,确保标注人员可以方便地进行标注、查看和修改标注结果。常见标注工具包括标签编辑器、图形界面工具等。 5. 多样化的数据源:使用多种数据源进行标注,可以降低标注的主观性和偏差性,并提高数据集的覆盖范围和丰富程度。 6. 数据隐私和安全保护:在标注过程中,需要注意保护用户隐私和敏感信息,确保符合相关的法律法规和隐私政策。 7. 更新和维护:知识图谱数据集是一个动态的、不断变化的过程,需要定期更新和维护,对新增的实体和关系进行标注,同时及时删除过时的实体和关系。 总之,知识图谱数据集标注需要严格遵循标注规范,保证数据质量,合理选择标注工具,确保数据隐私和安全,并定期更新和维护数据集
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值