TIMIT Acoustic-Phonetic Continuous Speech Corpus(简称TIMIT)是一个声学-音素连续语音语料库,由德州仪器(TI)、麻省理工学院(MIT)和SRI International(SRI)合作构建。
TIMIT数据集的语音采样频率为16kHz,一共包含6300个句子,这些句子由来自美国八个主要方言地区的630个人每人说出给定的10个句子构成。所有的句子都在音素级别(phone level)上进行了手动分割和标记。在这个数据集中,70%的说话人是男性,而大多数说话者是成年白人。
给定的10个句子中,包括2个方言句子(对于每个人这两个方言句子都是相同的)和5个音素紧凑句子(这5个句子是从MIT所给的450个因素分布平衡的句子中选出,目的是为了尽可能的包含所有的音素对)。
TIMIT数据集通常用于语音识别、语音合成以及语音相关的机器学习算法的研究和开发。由于它包含了大量的语音数据,并且数据已经被仔细地分割和标记,这使得它成为了一个非常有价值的数据集。
获取方法:
方法1:注册LDC账号并加入组织获取数据,官网链接:LDC官网
方法2:关注公众号,回复TIMITLDC语料小助手https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg