文章目录
1. 赛题背景
本次赛题以“小布助手对话短文本语义匹配”为课题,比赛链接为:https://tianchi.aliyun.com/competition/entrance/531851/introduction。小布助手是OPPO公司为欧加集团三品牌手机和IoT设备自研的语音助手,为用户提供了有趣、贴心、便捷的对话式服务。
意图识别是对话系统中的一个核心任务,而对话短文本语义匹配是意图识别的主流算法方案之一。本赛道要求参赛队伍根据脱敏后的短文本query-pair,预测它们是否属于同一语义。
2. 赛题数据介绍和评测标准
训练数据包含输入query-pair,以及对应的真值。初赛训练样本10万,复赛训练样本30万初,训练数据全部脱敏。
其中每行为一个训练样本,由query-pair和真值组成,每行格式如下:
- query-pair格式:query以中文为主,中间可能带有(如英文缩写、品牌词、设备型号等)的少量英文单词,编码方式