什么是数据标注?数据标注是指给原始数据(如图像、视频、文本、音频和3D点云)添加标签的过程,带有标签的数据被称为训练数据,这些标签形成了数据属于哪一类对象的表示,帮助机器学习模型在未来遇到从未见过的数据时,也能准确识别数据中的内容,训练数据可以有多种形式,包括图像、语音、文本或特征,这取决于所使用的机器学习模型和手头要解决的任务。
为什么需要数据标注?
我们了解到的数据标注,其实就是人工智能的重要组成部分之一,我们现在先来了解一下人工智能。人工智能组成部分有三个算法、算力、标注。
算力相当于看书需要眼睛;
算法相当于思考需要大脑;
标注相当于书里面的知识。
人工智能运行的基本逻辑是:AI需要用眼睛算力查看,记录数据书里面的知识,然后用大脑算法,转换成自己知识,最后应用学到的知识用来工作,所以数据标注相当于机器的“燃料”,有了数据AI才能用算法+算力辨别场景进行工作。