TIDIGITS数据集主要包含11个孤立数字,分别为one、two、three、four、five、six、seven、eight、nine、oh和zero。这个数据集通常用于语音识别和语音处理任务。
在数据准备阶段,需要建立任务语法,例如使用类似$digit= ( one | two | three | four | five |six | seven | eight | nine | zero | oh ); ([sil] <$digit sp> [sil])
的语法描述。在这个语法中,|
表示可选择的选项,尖括号< >
表示一次或多次重复,中括号[ ]
表示可选择的内容。
对于TIDIGITS数据集中的语音识别任务,HTK(Hidden Markov Model Toolkit)是一个常用的工具包。HTK识别器需要一个用Standard Lattice Format (SLF)建立的词的网络,该网络描述了词与词之间的转移。可以使用Hparse命令来创建这个词的网络,而digit.gram
文件通常是手工编辑的。
获取方法:
方法1:注册LDC账号并加入组织获取数据,官网链接:LDC官网
方法2:关注公众号,回复TIDIGITSLDC语料小助手https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg