数据标注工程笔记

环境准备
精灵标注助手

精灵标注助手-人工智能数据集标注工具 (jinglingbiaozhu.com)

labelimg

pip install labelimg
数据采集、标注:手工活

导出

数据采集导出格式:xml、json、MongoDB、pascal-voc

采集出来的数据是网络方向标签化的数据

xml

网络标签化数据、网络传输不发达时创建

但是结构方便仍在数据处理适用

可以当成结构体、类

可以根据自己的设计需求定义专属的标记

标签语言:网络语言的表现形式,java、html、xml

XML 简介 - XML (可扩展标记语言) | MDN (mozilla.org)

精灵标记助手采集的xml格式数据
<!-- 矩形框采集 -->
<!-- 标记失败 -->
<?xml version="1.0" ?>
<doc>
	<path>D:\yyqh\DataSet\set1\8805d9c7c825a211eacec94f37b871e9.jpeg</path>
	<outputs></outputs>
	<time_labeled>0</time_labeled>
	<labeled>false</labeled>
</doc>


<!-- 标记成功,但识别失败 -->
<?xml version="1.0" ?>
<doc>
	<path>D:\yyqh\DataSet\set1\data (1).jpeg</path>
	<outputs>
		<object></object>
	</outputs>
	<time_labeled>1695689497928</time_labeled>
	<labeled>true</labeled>
	<size>
		<width>1000</width>
		<height>1506</height>
		<depth>3</depth>
	</size>
</doc>


<!-- 成功 -->
<?xml version="1.0" ?>
<doc>
	<path>D:\yyqh\DataSet\set1\data (2).jpeg</path>
	<outputs>
		<object>
			<item>
				<name>猫</name>
				<bndbox>
					<xmin>10</xmin>
					<ymin>-1</ymin>
					<xmax>974</xmax>
					<ymax>1761</ymax>
				</bndbox>
			</item>
		</object>
	</outputs>
	<time_labeled>1695689802263</time_labeled>
	<labeled>true</labeled>
	<size>
		<width>1000</width>
		<height>1778</height>
		<depth>3</depth>
	</size>
</doc>
<!-- 曲形框/锚点采集 -->
<?xml version="1.0" ?>
<doc>
	<path>D:\yyqh\DataSet\set1\data (4).jpeg</path>
	<outputs>
		<object>
			<item>
				<name>柠檬</name>
				<cubic_bezier>
					<x57>25</x57>
					<y57>505</y57>
					<x57_c1>25</x57_c1>
					<y57_c1>505</y57_c1>
					<x57_c2>25</x57_c2>
					<y57_c2>505</y57_c2>

					<!-- 这一部分是比较复杂的坐标,所以省略 -->

					<x1>25</x1>
					<y1>505</y1>
					<x1_c1>25</x1_c1>
					<y1_c1>505</y1_c1>
					<x1_c2>25</x1_c2>
					<y1_c2>505</y1_c2>
				</cubic_bezier>
			</item>
		</object>
	</outputs>
	<time_labeled>1695690362440</time_labeled>
	<labeled>true</labeled>
	<size>
		<width>1080</width>
		<height>757</height>
		<depth>3</depth>
	</size>
</doc>

# 不能直接选全图嘛

pascal-voc

目标检测数据集

csdn:PASCAL VOC数据集简介

MonogoDB

基于分布式文件存储的数据库。由C++语言编写。

csdn:MongoDB详解,用心看这篇就够了【重点】

数据库交互、网络共享

vb # 被淘汰?但某方面实用

python # 不热门了

虚拟仿真 # 研究不了

数据结构、栈

数据标注众包平台——数加加

数加加-数据堂旗下众包平台:海量的数据采集和标注任务 (shujiajia.com)

github

GitHub: Let’s build from here · GitHub

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
超级数据标注是指高质量且准确的数据标注过程。数据标注是将无标签数据添加标签或注释以便于计算机理解的过程。在许多应用领域,如机器学习、自然语言处理和计算机视觉中,大量的标注数据是必不可缺的。超级数据标注意味着在数据标注过程中,专业的标注团队通过严格遵循规范和准确性来完成标注任务。 超级数据标注的一大优势是高质量的标注结果。专业的标注团队具有专业的知识、经验和技能,能够准确地理解标注要求,并按照要求进行标注。他们可以保证标注结果的准确性和一致性,减少误差和不确定性。这对于训练机器学习模型和评估算法的性能非常重要。 此外,超级数据标注还可以提供多级标注和多种标注方法。这意味着数据可以通过不同层次和不同的标注方法进行标注,从而提供更多的信息和灵活性。这可以帮助机器学习算法更好地理解和处理数据,提高模型的性能和效果。 超级数据标注还可以提供实时标注和持续更新。随着技术的不断发展和数据的持续增长,标注数据需要及时更新和补充。专业的标注团队可以根据需要及时进行标注,并随时更新标注结果。这可以确保训练和测试数据的时效性和准确性。 综上所述,超级数据标注是一种高质量、准确性和灵活性的数据标注过程。它为机器学习算法和评估提供了重要的基础,并在许多领域中发挥着重要的作用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值