HTK的数据准备工具主要是针对语言文件和语音标签数据文件的处理,前面介绍了处理语音标签数据文件的处理工具,如下:
- HLEd。根据发音词典,自动对标签文件进行标记。该工具还可以对标签文件进行编辑处理,其实主要是对标签文件进行编辑,按照发音词典进行扩展也是编辑的一种,另外可以对发音词典进行替换、删除、写入等编辑操作。参见:数据准备工具-HLEd
- HLStats。这个工具主要是对标签文件根据发音词典展开之后的标记文件和HMM模型列表进行统计。参见:数据准备工具-HLStats
上面的两个工具都是对标签文件进行处理,包括自动标记及统计等功能,当然,需要发音词典作为输入,其实也是根据发音词典而统计的单音列表。
本文讨论对音频数据文件的处理工具:HCopy。这个工具是将原始的音频数据文件(如WAV)转换成HTK格式的参数文件。
一,