HTK中vocab的节点种类

分三种:

一是nullWord,它是不发音的,也就是nullWord->pron==NULL,nullWord->nprons==0;它的wordName->name为“!NULL”;

另一个是subLatWord,特殊的子结构节点;

这两个节点都是比较特殊。其他大量的普通字典项保存在wtab中。它是一个哈希表。

typedef struct {
   int nwords;          /* total number of words */
   int nprons;          /* total number of prons */
   Word nullWord;       /* dummy null word/node */
   Word subLatWord;     /* special word for HNet subLats */
   Word *wtab;          /* hash table for DictEntry's */
   MemHeap heap;        /* storage for dictionary */
   MemHeap wordHeap;    /* for DictEntry structs  */
   MemHeap pronHeap;    /* for WordPron structs   */
   MemHeap phonesHeap;  /* for arrays of phones   */
} Vocab;

看上面是字典Vocab的结构代码,nwords和nprons两个int变量,如果发音字典包含多音字,那么这俩值是不同的,或者有的词缺发音信息,也会造成不相等。

nullWord对应Lattice中的!NULL节点,而subLatWord对应的是Lattice中子网络结构。wtab中存储就是普通的词信息。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值