智能标注的程序实现

最新推荐文章于 2023-02-24 09:56:22 发布

置顶

深度学习与图像目标检测

最新推荐文章于 2023-02-24 09:56:22 发布

阅读量1.4k

点赞数

本文链接：https://blog.csdn.net/weixin_39153202/article/details/83069921

版权

没错，这次笔者将触手伸向了图像标注行业。这是人工智能的一个子行业，做数据标注和数据清洗的，俗称“打标签”。我们先来看一看这个行业的人工量有多大，这是百度搜索的结果。这个行业承包了人工智能脏活累活，是人工智能中的劳动密集型行业（人数之多见图中红色的方框）。

具体的人工量，读者们可以上网搜索，人工智能行业的从业者就更有深刻体会啦。既然说人工智能提高生产效率，总不能让这种劳动密集的现象长期存在，于是笔者这次又坐不住啦，想通过算法改进，自动打标签，解放底层数据标注人员的双手。但考虑到一些读者并没有行业背景，本文尽量讲得浅显易懂，争取内行看到门道的同时，也让吃瓜群众看个热闹。

图像目标识别是人工智能的重要分支，那么怎样实现图像识别呢？首先我们需要对大量的图像进行整理，告诉计算机什么是我们想要发现的目标；然后把这些整理好的图像放到网络中训练，让机器去学习；训练好机器之后，他就可以去自动识别目标啦。上面说的第一步，即“整理图像”的过程，第一步，就是对图像进行标注，也就是告诉计算机，什么是目标。以找浣熊为例，我们要在图像中指出来，什么是浣熊。我们找到张图像，如下所示

然后，我们需要在图像中指出来，什么是浣熊：

这个在图像中“找浣熊”的过程，就称为“图像标注”。图像标注是深度学习领域最累的工作之一，因为这样找目标看似简单，但需要大量重复。比如Imagenet和COCO这样超级大的数据库，动不动就10万+。另外图像标注的精度也很重要，咱们首先得好好教计算机，什么是浣熊，他才能学会去判别，如果我那只熊猫告诉计算机，这是“浣熊”，那你说他是什么心情？所以说，图像标注很重要。科普到此为止（累死我啦），下面，开始说正事，怎样解放人手，降低我们图像标注人员的工作量，实现智能标注。

通常用到的标注工具是LabelImg，别问我为什么用这个，我喜欢。它会针对pascal和yolo生成不同的数据格式，本人用的tensorflow的object detection api，涉及到的多是pascal文件格式，标注文件格式是.xml（应该说大部分人也是这种思路），因此这里主要针对这种格式进行讲述。所谓的“智能标注”，就是利用先期数据训练好网络，对新数据监测，产生标签

最低0.47元/天解锁文章

深度学习与图像目标检测

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
智能标注的程序实现

没错，这次笔者将触手伸向了图像标注行业。这是人工智能的一个子行业，做数据标注和数据清洗的，俗称“打标签”。我们先来看一看这个行业的人工量有多大，这是百度搜索的结果。这个行业承包了人工智能脏活累活，是人工智能中的劳动密集型行业（人数之多见图中红色的方框）。具体的人工量，读者们可以上网搜索，人工智能行业的从业者就更有深刻体会啦。既然说人工智能提高生产效率，总不能让这...
复制链接

扫一扫