1. 第一名
1.1 算法方案解析
1.1.1 题目描述
-
初赛共有17种语言,分别是: 匈牙利语、希腊语、塞尔维亚语、斯洛伐克语、格鲁吉亚语、克罗地亚语、斯瓦西里语、阿姆哈拉语、马来语、菲律宾语、高棉语、孟加拉语、土耳其语、僧伽罗语、阿塞拜疆语、希伯来语、南非祖鲁语;
-
复赛增加3种高混淆度语言,分别是: 埃及阿拉伯语、沙特阿拉伯语、阿联酋语阿拉伯语。
-
数据说明:
- 每种语言平均包含1小时的朗读风格语音数据。
- 数据由各个型号的智能手机采集。
- 录制环境包含安静环境和噪声环境。
- 数据以采样16000Hz,18比特量化的PCM格式存储。
- 训练集每种语言约有250句左右语音:开发集和测试集分别每种语言约有400句左右语音,初赛复赛的开发集和测试集的数据根据语音段的时长均为有效语音长的三秒的短时语音数据。
训练集虽然只有250个句子,但是每个句子为平均10s的长句子。而验证集和测试集