图形深度学习中,我们都离不开如何对数据进行采样、分类、标记也叫标注,从而通过模型训练达到我们需要的训练结果并对其进行比对检测,其应用场景可在航空航天、人工智能、厨房家居、医疗科技、教育、旅游等。
那如何做好数据标注就成为了所有环节的起始点和重点,数据标注的准确不够,就不能很好的快速识别问题和得到良好的结果。
问:我是如何做数据标注的呢?
答:我之前一直使用的是Roboflow平台,该平台主要有以下功能:
- 在线标注数据开源平台;
- 可在标注的同时从其他用户得到对应的开源标注数据或借鉴;
- 多人协同平台,可同时多人对数据项目进行标注共同完成;
- 平台提供在线训练能力(新注册用户免费尝试)
下面我展示出使用该平台标注的全部流程(这里我会用部分柯南动画的人物识别举例):
- 首先你需要在该平台注册一个账户并登录;
- 进入左上角的Project;
- 点击新建项目
- 创建时我一般使用物体检测(Object detection),不是分类或形状标记描述等,创建时注意License,默认CC BY 4.0,具体规则我就不在这里讲了,可以搜索查一下
- 再次注意:项目创建后,默认都是可以被外部人员通过该平台查看到的,如果不想被公开,需要付费。
- 项目创建后,上传需要训练的图片并点击保存和继续按钮
- 上传完成后界面如下,可点击右上角标注按钮进入标注页面
- 接下来就是之前提到的多人协同标注部分,在该步骤可通过邀请或指定任务给他人同时进行标注。分配好标注人选就可以点击标注按钮啦
- 继续点击开始标注
- 这时才真正进入到数据标注的画板中
- 画板的详细功能太多, 这里我只讲标注部分常用功能:手动标注和自动标注
- 手动就是自己画以下这样的方框,然后输入或选择数据分类
- 自动就是使用Roboflow自带图像识别能力通过鼠标点击识别鼠标点击区域的图像。复杂场景我一般使用自动,后续识别准确度高一些
自动识别,鼠标到对应位置的待标注数据识别效果
- 自动识别时,可联系点击多个区域实现多区域的数据自动描边标记
- 为方便演示,我仅标注部分数据
- 标注后可在左侧面板查看标注了哪些数据
- 待数据全部标注完成,点击左上角返回按钮,再点击画面中的Add to Dataset(添加到数据集)按钮
- 我这里使用了3张图片,1张用来训练,1张用来验证,1张用来测试,具体可搜索为什么要这么做
接下来就是训练和模型验证了,我会在后续的”图形深度学习之炼丹必备技能-数据训练”文章中具体介绍如何做好数据训练。
点个小心心或赞同再走吧。
喜欢的同学可评论等方式交流。