智能标注的程序实现

       没错,这次笔者将触手伸向了图像标注行业。这是人工智能的一个子行业,做数据标注和数据清洗的,俗称“打标签”。我们先来看一看这个行业的人工量有多大,这是百度搜索的结果。这个行业承包了人工智能脏活累活,是人工智能中的劳动密集型行业(人数之多见图中红色的方框)。 

      具体的人工量,读者们可以上网搜索,人工智能行业的从业者就更有深刻体会啦。既然说人工智能提高生产效率,总不能让这种劳动密集的现象长期存在,于是笔者这次又坐不住啦,想通过算法改进,自动打标签,解放底层数据标注人员的双手。但考虑到一些读者并没有行业背景,本文尽量讲得浅显易懂,争取内行看到门道的同时,也让吃瓜群众看个热闹。

       图像目标识别是人工智能的重要分支,那么怎样实现图像识别呢?首先我们需要对大量的图像进行整理,告诉计算机什么是我们想要发现的目标;然后把这些整理好的图像放到网络中训练,让机器去学习;训练好机器之后,他就可以去自动识别目标啦。上面说的第一步,即“整理图像”的过程,第一步,就是对图像进行标注,也就是告诉计算机,什么是目标。以找浣熊为例,我们要在图像中指出来,什么是浣熊。我们找到张图像,如下所示

然后,我们需要在图像中指出来,什么是浣熊:

       这个在图像中“找浣熊”的过程,就称为“图像标注”。图像标注是深度学习领域最累的工作之一,因为这样找目标看似简单,但需要大量重复。比如Imagenet和COCO这样超级大的数据库,动不动就10万+。另外图像标注的精度也很重要,咱们首先得好好教计算机,什么是浣熊,他才能学会去判别,如果我那只熊猫告诉计算机,这是“浣熊”,那你说他是什么心情?所以说,图像标注很重要。科普到此为止(累死我啦),下面,开始说正事,怎样解放人手,降低我们图像标注人员的工作量,实现智能标注。

       通常用到的标注工具是LabelImg,别问我为什么用这个,我喜欢。它会针对pascal和yolo生成不同的数据格式,本人用的tensorflow的object detection api,涉及到的多是pascal文件格式,标注文件格式是.xml(应该说大部分人也是这种思路),因此这里主要针对这种格式进行讲述。所谓的“智能标注”,就是利用先期数据训练好网络,对新数据监测,产生标签

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值