对于做语音识别的人可以看看:
TIMIT数据集是来自美国630个人每个人说十个给定的句子,每一个句子都有标记
TIMIT数据集介绍
如:这篇博客:http://blog.csdn.net/jie8895010/article/details/52425784
格式如下:
ID <SA> <-------- SX ---------> <----- SI ----->
;--- ---- ----------------------- ----------------
ABC0 1 2 331 61 241 421 151 781 1620 2041
ABW0 1 2 134 314 44 224 404 1230 1664 2294
ADC0 1 2 287 17 197 377 107 737 1367 1997
ADD0 1 2 88 268 448 178 358 538 1295 1798
ADG0 1 2 199 379 109 289 19 649 1279 1909
AEB0 1 2 90 270 450 180 360 990 1411 2250
AEM0 1 2 312 42 222 402 132 762 1392 2022
AEO0 1 2 246 426 156 336 66 1655 1326 1956
AFM0 1 2 39 219 399 129 309 939 1569 2199
AHH0 1 2 214 394 124 304 34 664 1294 1924
AJC0 1 2 385 115 295 25 205 835 1946 2095
......
......
数据集下载百度网盘:
链接:http://pan.baidu.com/s/1o7YYx9w
密码:wd6d