一、倍赛BasicFinder 数据采集整体流程设计(如下图):
A)采集需求:数据需求方根据自身需求制定好需求文档;
B)需求文件分析:有数据顾问直接对接客户,通过培训会议等方式,充分理解需求;
C)采集搭建环境和设备调试:针对于定制化较高的数据进行采集环境的搭建和设备采购以及调试;
D)项目测试:建立采集数据样本,反馈客户,再次沟通采集数据与需求的贴合度;
E)定义采集方案:采集数据样本与需求贴合度合格后,将会为批量采集数据定制执行方案;
F)筛选标注人员:根据数据需求匹配合适团队(若是众包平台,则通过平台机制筛选合格采集人员);
G)采集数据:数据采集执行,跟进项目的执行进度;
H)审核:倍赛BasicFinder自营数据中心专职质检员进行数据质检;
I )验收:将合格数据交付数据需求方。
二、倍赛BasicFinder 数据采集执行方式:团队采集+众包平台采集
1. 团队采集数据
倍赛BasicFinder 创建了采集团队管理库,该团队管理库中的成员分布于全球不同区域,同时每个团队在过往合作项目的执行结果反馈,被赋予不同的标签,标签属性包括“擅长数据类型”“团队规模”“团队所在区域”“工期准时率”“采集数据质量度”“泛化度”等,倍赛BasicFinder可根据客户的需求通过标签充团队管理库中迅速匹配合适的团队执行任务。
2. 众包平台数据采集
倍赛BasicFinder旗下数据采集荟萃众包平台流程设计如下图:
A)数据需求:倍赛与数据需求方对数据的类型、数量、背景环境、动作姿态、光线等进行沟通和确定;
B)任务发布:将需求方对数据的要求整理成详细的需求文档,并通过荟萃众包APP发布;
C)用户筛选:通过荟萃平台标记的用户标签,选取适宜对应需求的用户进入项目测试;
D)测试:通过与采集需求相对应的默认任务来测评用户对需求文档的理解程度,以保证用户采集数据的可用性;
E)培训系统:帮助用户学习理解需求文档,以及提升对数据判断的准确性;
F)数据采集:通过测试用户,严格依照需求文档使用移动设备对“图像”“音频”“视频”等数据进行采集;
G)作业审核:倍赛自营数据中心全职审核员对用户采集数据进行审核;
H)数据销毁:对于不符合需求方的数据进行销毁处理;
I )数据交付:合格数据按照需求方要求的方式交付。