近日,Magic Data(北京爱数智慧科技有限公司)上榜互联网周刊 2022 数据标注公司排行榜 Top3。
人工智能大道的 “基石”
人工智能的目标指向了对人思维过程的复刻,它希望将人的智能脱离肉体的限制,延伸到机器上,使得机器能够像人类一样面对变化的外部环境,综合做出判断和行为反应。在这项探索的初始阶段,我们已经看到包括机器人、语言识别、图像识别、自然语言处理等在内的各分领域分级别的研究成果。
在大众传播和科幻想象中,人工智能往往以一种“酷炫”的形式作为最终的结果呈现,而探究人工智能何以形成的机制则会发现,它不似人想象的那样轻松和神秘。
数据标注就是目前机器实现智能化一个必不可少的过程,它指的是在采集数据后,通过分类、分割、关键点线标注、画框、追踪等处理方式,对文本、图片、语音、视频等原素材进行标记注释,将多源异构的数据转化成可识别的AI训练数据,从而成为机器学习的基础材料。
这个过程并不如同想象中那样简便和迅速,反而显得有点“笨拙”,机器的学习并不像人那样具备主动的记忆、认知、理解能力,它更像是一种计算,在大量相似数据标注为一件物品后,经过比对,它才能“认识”到物品的属性。
例如在图像的数据标注中,一张图片包含的实体会逐一分割开来ÿ