人工智能数据标注都有哪些类型
人工智能数据标注指的是,将非结构化数据转换成电脑可以识别理解的结构化数据。
例如,将下图中的车识别出来,人看到车的外轮廓是:
但是需要让电脑去识别认知这个图中的车,电脑需要的是下图这种json或者xml结构,才能认知出车。
这个让电脑认识车的这个能力,是通过人工智能算法+标注数据,训练得出来的。通常想要得到人工智能识别一个物体的能力达到99%,需要数万的标注数据,才可能训练出来。所以,随着人工智能应用的大量需求,标注数据的需求量也在成倍的增长,
理解了数据标注是什么,那么,都有哪些数据需要进行处理呢?随着人工智能算法的研究,我们需要进行识别的数据主要有以下几类:
1、语音标注:
我们最常接触的标注,就是在音频文件中,将对应的文字输入进去,可以是中文,外文,方言等,通常用于文字的转写。
随着算法的研究,需要对音频文件中的,语气词,等标注进去,对这句话的问题,重点进行分析,或者说是这段音频中,是否包含违法敏感元素等等。
2、文本标注:
情感标注:此类标注通常需要判定一句话包含的情感,如三级情感标注(正向,中性,负向),要求高的会分成六级甚至十二级情感标注。
实体标注:实体标注需要将一句话中的实体提取出来,如电视,足球,门等。有时候还需要将划分这句话的类别如音乐,百科,新闻等或者是标注出文本中的动作指令(开门,播放等)。
相似性判断:这种标准多集中在两个文本之中,通常需要判断两句话表达的含义是否一致。如果一致标1,不一致标-1,无法判定标0.
其他类文本标注:其他类的文本标注如舆情标注,判断一段文章提及的公司是积极还是消极的影响。还有文章敏感性检测判断文本内容有无违法敏感信息。
3、图片标注
矩形拉框:这个在数据标注中属于2D拉框,通常需要拉一个矩形框贴合框选出待检测物体(人,动物,汽车等等)。框选出待检测物体之后还需要对所选框添加一个或多个标签进行注明,以人为例的话可能需要注明人的性别、年龄、衣着等。
多边形拉框:多边形拉框和矩形拉框类似,不过多边形拉框的要求更高需要围绕标注元素的轮廓进行标注,多以点框的形式进行。多边形拉的框往往也需要添加标签来对元素进行注明。
打点:打点需要根据要求对人脸或关键部位进行打点标注,往往此类标注会对每个点的位子进行限制和要求,从而实现高精度的检测识别。此类标注对人员的要求较高,可以用于运动检测、打架行为检测等。
OCR识别:OCR识别分为两部分一部分是拉框,框选出待检测部位此部分与上述多边形拉框较为相似多用点框的方式进行操作,第二部分则需要对框选部分的内容进行高准确性转写。此类打标好的数据往往应用于文本检测模型的训练。
语义分割:此类标注与拉框打点比起来占的比例较少,但目前此类标注有增加的趋势。此类标注需要对图片内的元素进行区分,并对每部分分别进行标注填色,一般需要先向ps抠图那样讲此部分元素抠出来然后再选择属性标签,这样此部分元素就切割出来了。
图片审核分类:此类标注需要根据要求对张图片进行判定。有的是需要将图片进行分类,有的是判断图片内容时候符合要求,也有的是判断两张图片或几张图片是否属于一类或者同一环境下。
4、视频标注
将视频转化成单帧,进行图片同一类型的标注。
对视频中某一段时间点上发生的事件、动作等,增加标签进行行为识别标注。
5、3D点云标注
3D点云是近期才兴起的标注方式,针对雷达回传数据,形成点云的三维空间。在三维空间中进行物体的识别标注,点云的算法研究,解决了自动驾驶对机器视觉盲区的判定,极大促进了自动驾驶技术的发展。
以上是目前通用的数据标注类型,但是人工智能的算法研究,未来会出现更多的标注形式。关注觉醒向量官网http://www.awkvector.com/,下期将分享各种类型的数据标注工具。