数据集说明文档

林林宋

已于 2023-04-11 21:42:28 修改

阅读量2.8k

点赞数 1

分类专栏：语音预处理文章标签：语音识别人工智能

于 2019-04-17 14:28:45 首次发布

本文链接：https://blog.csdn.net/qq_40168949/article/details/89355450

版权

13 篇文章

订阅专栏

thu30–清华30h的中文测试数据

http://www.openslr.org/18/
在这里插入图片描述
30个中文说话者，识别数据集，包括22个女性说话者和8个男性说话者

male	A5、A8、A9、A33、 A35、B8、B21、D8
female	其余的

109个说话者，每个人大概400条句子，native english speaker，读报纸
所有记录都转换为16位，根据STPK下采样到48 kHz
http://homepages.inf.ed.ac.uk/jyamagis/page3/page58/page58.html

selected10–

female	229、240、248、249、253
male	241、245、246、251、255

男声46人
在这里插入图片描述
共计male—46
female—62

数据集下载链接 http://festvox.org/cmu_arctic/packed/

male	aew, ahw, aup, awb, ksp, rms, rxr,bdl
female	axb, eey, ljm, slp, slt
其中aew/eey有麦克风的电流声，在频谱上可以看到稳定的背景噪声，尤其是在静音段

来自美国的630人，来源于美国八个主要方言地区，因此带有不同的口音，每人说10句话，一共包含6300个句子。所有的句子都在音素级别(phone level)上进行了手动分割，标记。70%的说话人是男性；大多数说话者是成年白人。

下载目录http://www.openslr.org/12
为tts任务从librispeech中挑选的语音，信噪比基本在20db以上
在这里插入图片描述

340个说话人, male-161, female-179
成都

https://www.openslr.org/28/

https://sites.google.com/site/unvoicedsoundseparation/mir-1k
http://mirlab.org/dataset/public/
在这里插入图片描述

https://smcnus.comp.nus.edu.sg/nus-48e-sung-and-spoken-lyrics-corpus/