人脸关键点标注工具_【走近AI】浅谈数据标注的故事。

我们要站在人工智能角度构建人工智能数据工厂。将制造业工业化流水线的百年经验应用到人工智能数据加工领域,利用智能化工具实现“人工”+“智的闭环( human in the loop),实现低成本、高效率、大规模、安全合规的数据生产。这种用流水线模式对人工智能数据进行预处理是未来人工智能产业化发展必然。

传统的人工智能数据生产过程是人工标注后再训练,缺乏人工智慧的再次反馈和纠错。可以在大量的人工智能数据生产过程中,采用人工标注与智能工具标注的送代交互式的生产过程来提高效率,沉淀业务知识,如下图所示。

286eacdf1636369b94486e15a243ca58.png

(1)人工标注提供机器模型识别的冷启动数据。

(2)工具增量学习人工标注行为,逐渐具备基础的、显而易见的识别和预测能力。

(3)人工标注不断,智能工具的学习不断。

(4)由人工决策识别结果的正确性,直到智能工具接近人类水平,此领域攻克。

1、数据标注是人工智能运算的技术

数据标注是人工智能的基础,也是围绕人工智能算法要求进行标注的。算法需要计算人脸的眉间距,那么标注过程就要找到眉间距的点出来。只有完成了这些基本的数据标注,才能进行人工智能算法应用。如果没有数据标注过程,那人工智能将“巧妇难为无米之炊”。有了这些标注数据之后,人工智能算法才能进行计算,例如,两眼角间距、鼻子尖的位置等。如前所述,目前人脸识别可以标注120个点进行特征计算。

2、图片数据的标注问题

图片数据不仅是标注人脸照片,还有很多的内容,例如,标识人物的动作情况。这时要表述岀人物动作的关键点,例如胳膊肘、手腕、膝盖、脚踝等关键位置点。以此,可以判断一个人的大致动作情况。图片标注远不止是人类的标注,也包括物体识别标注等。例如,如果要识别万选取的各种食物,就需要进行各种饭菜的图片识别工作。有了这些图片标注之后,就可以借助YOLO3等进行物体识别的算法训练。

3、数据标注是新的“富士康”工厂?

从上面例子可以看出,数据标注是个十分消耗体力的工作,需要大量的人力

进行标注工作。

而中国具有大量的廉价劳动力,所以可以说,借助中国人的勤奋,中国的人工智能很有可能完成一次历史超越。

在电子产业中,中国人以富士康工厂的代工生产而闻名遐迩。数据标注企业也是一项劳动密集型的工作内容。所以,下一个发展阶段,中国也可以发展自己的数据标注产业。不仅可以赚取新一轮的外汇储备,更可以提升中国在人工智能领域的快速发展。

本轮人工智能的发展过程中,中国不仅有大数据数量方面的优势,还有一个重要优势就是大量的人力可以进行数据标注工作。同时,中国又是数据领域的大国,国民数学基础比较扎实,算法能力相对较强。

所以,中国完全有机会抓住本轮人工智能技术的战略发展机遇,实现弯道超车,完成产业升级工作。

0be1d5d5c596b0fcf7f743872353fa32.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值