TIDIGITS数据集介绍，官网编号LDC93S10

最新推荐文章于 2024-09-14 22:50:53 发布

ldcdata

最新推荐文章于 2024-09-14 22:50:53 发布

阅读量485

点赞数 1

文章标签：自然语言处理 python 深度学习人工智能

本文链接：https://blog.csdn.net/ldcdata/article/details/138806272

版权

TIDIGITS数据集主要包含11个孤立数字，分别为one、two、three、four、five、six、seven、eight、nine、oh和zero。这个数据集通常用于语音识别和语音处理任务。

对于TIDIGITS数据集中的语音识别任务，HTK（Hidden Markov Model Toolkit）是一个常用的工具包。HTK识别器需要一个用Standard Lattice Format (SLF)建立的词的网络，该网络描述了词与词之间的转移。可以使用Hparse命令来创建这个词的网络，而digit.gram文件通常是手工编辑的。

获取方法：

方法1：注册LDC账号并加入组织获取数据，官网链接：LDC官网

方法2：关注公众号，回复TIDIGITSLDC语料小助手https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg