HDMan命令

HDMan命令的主要功能是从多个输入生成发音字典。它支持在脚本中编辑命令行功能,就是可以按照定制好的方式生成发音字典。

每个编辑命令在脚本中都是单独的一行,如果HDMan命令没有任何的脚本编辑命令指定,该命令就将输入简单的排序并输出。每个输入字典文件都对应一个编辑命令脚本文件,如输入字典文件为example.dict,那么在指定的目录下可以存放编辑命令脚本文件example.ded,当然,如果没有这个脚本文件,最多也就警告,不会出错的。另外有一个特殊的脚本文件global.ded,这个脚本是针对合成之后的字典文件。

如果多个输入文件指定同一个单词的不同发音,此时默认的行为是第一个有效,后面的都会被忽略。

1, 脚本文件命令

脚本文件有如下编辑命令:

1.AS A B 。添加静音模型A和B。

2.RS system 去掉重音标记。

3.MP X A B 。 在等待合成的发音序列中,如果出现A B,重新命名为X

4.RW X A B 在单词中出现A或者B,将其替换为X

5.RP X A B ,在发音序列中,如果出现A或者B,替换为X

6.UP。转换所有的发音序列为大写。

7.UW。转换所有的单词为大写。

8.SP X A B ,将发音X分成新的发音序列A B

当然,除了上面的命令之外,其他还有。

2, 命令用法

HDMan [options]newDict strDict1 strDict2 …

从strDict1 strDict2中读取发音字典,并重新生成新的发音字典newDict。

常用选项如下:

1, -m 。前面说了这个命令如果碰到一个单词在多个输入文件中定义发音,则会忽略第一个之后的所有发音,但添加这个选项之后,就会将所有发音全部输出。

2, -w file。加载单词列表文件,file中存储了很多个单词,这个选项会控制输出的大小,如输入的发音文件有1000个单词,但列表文件中仅仅有10个,此时输出的发音文件中包含10个单词的发音。

3, -e dir。这个选项指定一个目录,这个目录是编辑命令脚本存储的路径。

4, -n file,这会输出一个单音列表,就是在单词列表中的单词的单音,而不是所有发音输入的单音。

5, -l file。日志

其它还有一些选项,主要是控制从多个发单文件(当然也可以是一个文件)中生成一个新的发音文件,可以按照我们指定的要求来生成,

3, 使用例子

HDMan -A -D -T 1 -m -w ./wlist -e ./input_files -n ./monophones-i -l logs/ HDMan_log ./ dict ./lexicon/lexicon

上面的例子中-A –D –T是标准的选项,大部分HTK命令行工具都有这个选项。另外还有-C –V和-S也是标准选项。C表示配置文件,S表示使用指定的脚本文件名,A表示当前的命令行参数会被打印。D表示输出显示配置信息。T表示Trace,一般的每个命令都有一些Trace配置参数,如上面的命令中使用-T 1表示Trace的信息是基本的程序执行进度报告。

后面的./dict为输出文件,而./lexicon/lexicon表示输入的发音文件。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值