目录
1、目标
在单句识别的阶段,通过工具提升标注质量和标注效率。
2、线下流程
由DrawIO流程图提供 · 问题反馈标注标准制定标注数据准备标注培训质检验收标注试标注任务分发标注数据整理离线测试优化语料库标注前标注中标注后标注目标制定试标注质检输出标注任务试标注交付算法灰度测试上线优化模型效果数据回收预期运行部分
3、建设思路
优先解决对效果有影响的和效率上有卡点的工具需求,先线下跑通,再搬到线上。
阶段 |
能力 |
现状 |
期望完善的能力 |
解决什么问题 |
优先级 |
需要资源 |
预计排期时间 |
备注 |
标注前 |
标注数据挖掘 |
先阶段取未识别数据进行标注,通过报表取数工具进行,缺少如标准问等维度,缺少筛选策略如去重 |
对回流语料的聚类和多维度筛选能力 |
|
P0 |
工程+算法 |
W52先把当前数据筛选逻辑线上化,提升输出任务效率,算法可同步探索语料筛选逻辑,完善后合并到功能中 |
对于新增的问题&# |