业务场景算法落地 - 利用预训练&伪标注&蒸馏实现一个通用的分类模型baseline
业务场景算法落地 - 利用预训练&伪标注&蒸馏实现一个通用的分类模型baseline
业务背景:场景化的智能对话助手下,某场景已经通过模板配置的方式冷启动并且在线上运行了一段时间(即通过线上日志可以收集到一些query),但是由于模板配置过泛导致该场景下误召回的话术过多,因此考虑增加一个分类模型来区分query是否属于该业务场景。
方案设计:
方案设计如上图,主要包含5部分:
1. 基于领域数据微调原生bert(领域数据来源于业务场景)
...
原创
2021-04-09 22:08:34 ·
421 阅读 ·
0 评论