1. 2000 HUB5 English: 从40个电话对话抽取的英语口语数据
2. LibriSpeech: Audiobooks的数据集,包含了500个小时不同读者读的audiobooks录音,根据audiobooks的章节进行组织的。
3. TED-LIUM: 1495个TED的演讲录音
4. Free Spoken Digit Dataset: 1500个英语读数字的录音
5. TIMIT: 630个美国英语发音的朗读者的数据集。
参考地址:LiveToolkit
1. 2000 HUB5 English: 从40个电话对话抽取的英语口语数据
2. LibriSpeech: Audiobooks的数据集,包含了500个小时不同读者读的audiobooks录音,根据audiobooks的章节进行组织的。
3. TED-LIUM: 1495个TED的演讲录音
4. Free Spoken Digit Dataset: 1500个英语读数字的录音
5. TIMIT: 630个美国英语发音的朗读者的数据集。
参考地址:LiveToolkit