thu30–清华30h的中文测试数据
http://www.openslr.org/18/
30个中文说话者,识别数据集,包括22个女性说话者和8个男性说话者
male | A5、A8、A9、A33、 A35、B8、B21、D8 |
---|---|
female | 其余的 |
VCTK
109个说话者,每个人大概400条句子,native english speaker,读报纸
所有记录都转换为16位,根据STPK下采样到48 kHz
http://homepages.inf.ed.ac.uk/jyamagis/page3/page58/page58.html
selected10–
female | 229、240、248、249、253 |
---|---|
male | 241、245、246、251、255 |
共计male—46
female—62
arctic
数据集下载链接 http://festvox.org/cmu_arctic/packed/
male | aew, ahw, aup, awb, ksp, rms, rxr,bdl |
---|---|
female | axb, eey, ljm, slp, slt |
其中aew/eey有麦克风的电流声,在频谱上可以看到稳定的背景噪声,尤其是在静音段 |
timit
来自美国的630人,来源于美国八个主要方言地区,因此带有不同的口音,每人说10句话,一共包含6300个句子。所有的句子都在音素级别(phone level)上进行了手动分割,标记。70%的说话人是男性;大多数说话者是成年白人。
libri-speech
下载目录http://www.openslr.org/12
为tts任务从librispeech中挑选的语音,信噪比基本在20db以上
AISHELL-1
340个说话人, male-161, female-179
成都
回声
https://www.openslr.org/28/
MIR歌唱
https://sites.google.com/site/unvoicedsoundseparation/mir-1k
http://mirlab.org/dataset/public/
NUS歌唱
https://smcnus.comp.nus.edu.sg/nus-48e-sung-and-spoken-lyrics-corpus/
对齐结果数据
keonlee9420个人训练的开源,包括以下数据集