0. 说明 (README)
感谢作者~
此CSTR VCTK语料库包含109英文说出的语音数据 具有各种口音的扬声器。 每个扬声器读出约400 从报纸上选出的句子,彩虹段落 还有一个用于语音口音档案的启发段落。 报纸文字经格拉斯哥先驱报许可 来自《先驱报》和时代集团。 每个演讲者都有不同的 报纸文本的选择基于贪婪算法,该算法增加了 上下文和语音覆盖。
彩虹的段落和启发段落对于所有人都是相同的
- 彩虹段落可以在国际方言中找到 英文档案馆: (http://web.ku.edu/~idea/readings/rainbow.htm)
- 启发 该段与用于语音口音存档的段相同 (http://accent.gmu.edu)。 语音口音档案的细节 可以在找到 http://www.ualberta.ca/~aacl2009/PDFs/WeinbergerKunath2009AACL.pdf
所有语音数据均使用相同的录音设置进行录音: 全向麦克风(DPA 4035),24时96kHz采样频率 钻头和在大学的半消声室中 爱丁堡。 所有录音均转换为16位,并进行了下采样 最高可达48 kHz(基于STPK),并且已手动设定端点
该语料库适用于基于HMM的文本到语音合成系统, 尤其适用于使用基于说话者的基于HM