HTK数据准备工具-HLEd

HLEd工具是针对语音标签的处理工具,这个工具可以根据发音字典,将发音序列的描述文件自动标记成发音词典的发音序列。在HTK中使用MLF格式的文件来描述发音序列。

一,基本用法

HLEd [options] edCmdFile labFiles ..
该命令执行完后,会对每一个labFile(语音标签文件)应用edCmdFile所指定的脚本文件,就是按照脚本文件指定的动作去处理每一个语音标签文件,相当于提供一个语音标签文件的编辑器。


二,主要选项

  1. -d s ,从s指定的文件中读取字典,如果编辑脚本行中执行EX命令的话,会用这个字典展开标签。
  2. - i mlf 。指定输出的标签文件。
  3. -g t 。这个选项和FG命令一起使用,设置最小的间隙检测时间,默认是5000.0,也就是5msecs,如果语音间隙比这个还短的话,就会被忽略,不会被自动标记。
  4.  -l s。这个选项标识输出的MLF文件的存储路径,默认是当前的目录。如果所有的输出都是输出到一个MLF文件,那么这个选项会在每个输出的文件名前面添加所指定的路径。一般的,把这个选项设置成 -l '*',这会在每个文件前面添加一个“*”。
  5. -n fn。这个选项会把新标签的列表全部输出到fn指定的文件中。
  6. -G fmt。设置标签文件格式为fmt。

三,主要脚本命令
  1. DE A B 。删除标签中出现的A或者B。
  2. EX。根据发音字典,扩展标签。
  3. IS A B 。在每个语音文本的开始部分插入标签A,在结束部分插入标签B。
四,实例

先准入一个已经存在的标签文件,作为输入语言标签文件(words.mlf),内容如下:
#!MLF!#
"*/sample01.lab"
ONE
ONE
ONE
ONE
ONE
ONE
ONE
ONE
这其实是表示一个sample01.wav的语音,其内容是某个人(本人)读了8个ONE的发音。

新建一个脚本文件,我的脚本文件是我希望在每一个标签文件的开始和结束部分插入sil作为silence模型,然后是根据发音字典扩展标签。脚本文件如下:(ed_script.led)
EX
IS sil sil
发音词典文件内容如下:pron.dict(这表示ONE的发音)
ONE             [ONE]           w ah n sp
三个文件如下:
[root@localhost test]# ls
ed_script.led  pron.dict  word.mlf
然后执行HLEd命令。
[root@localhost hled]# HLEd -A -D -T 1 -l '*' -d pron.dict -i labels.mlf ed_script.led word.mlf
HLEd -A -D -T 1 -l * -d pron.dict -i labels.mlf ed_script.led word.mlf 

No HTK Configuration Parameters Set

Editing file: sample01.lab
   26 adds; 0 deletes; 0 replaces; 0 changes; 0 merges

No HTK Configuration Parameters Set

[root@localhost hled]#

输出文件(labels.mlf) 的内容如下:
#!MLF!#
"*/sample01.lab"
sil
w
ah
n
sp
w
ah
n
sp
w
ah
n
sp
w
ah
n
sp
w
ah
n
sp
w
ah
n
sp
w
ah
n
sp
w
ah
n
sp
sil
.
如果我们想把sp音节给去掉,就修改ed_script.led文件,如下:
EX
IS sil sil
DE sp
然后执行上面的命令,输出文件内容如下:
#!MLF!#
"*/sample01.lab"
sil
w
ah
n
w
ah
n
w
ah
n
w
ah
n
w
ah
n
w
ah
n
w
ah
n
w
ah
n
sil
.

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值