记录一下语音方向的常用数据集,先介绍语音增强强相关的,后续陆续补充其他。
语音数据集
- openslr, OpenSLR是一个专门存放语音和语言资源的站点, 非常全面,包含语音、噪声和混响等数据集。
- DNS Challenge 微软举办的深度降噪挑战赛的数据集,已举办到第五届,包含语音和噪声等数据集,采样率有16k和48k。
- musan , A corpus of music, speech, and noise, 16k。
- MS-SNSD, Microsoft Scalable N
记录一下语音方向的常用数据集,先介绍语音增强强相关的,后续陆续补充其他。