为了进一步丰富开源语音语料库,促进语音语言处理技术的发展,Magic Data联合中科院声学研究所、上海交通大学和西北工业大学,在Magichub开源社区正式开源180小时中文对话式语音数据集MagicData-RAMC。MagicData-RAMC是一批高质量且标注丰富的训练数据,可以很好地支持开发者完成语音识别和说话人日志相关的研究。
数据集下载地址 MagicData-RAMC Conversational Speech Dataset – MagicHub
论文地址 https://arxiv.org/abs/2203.16844
基线地址 https://github.com/MagicHub-io/MagicData-RAMC-Challenge
同时,Magic Data(北京爱数智慧科技有限公司)联合中科