这篇主要介绍下flite和在windows下的cygwin中编译,以及选择espeak的原因。
从flite的介绍中可以看到,它是festival-lite,即festival的精简版,相对于Festival结构过冗余,速度太慢,它是一款短小精悍,快速实时的TTS引擎。Flite设计中兼容Festival的voiees和models,Flite使用HRGS(heterogeneous relation graphs)作为它的基本的发音代表结构。而且合成器的大部分内容是数据,比如字典,单元数据库等(lexicons,unitdatabaseetc),实际的代码量相当的小。对于festival,大部分数据存在在外部文件中,依需要而下载,而对于Flite来说,因为它是非常小的一个引擎,所以允许核心数据在ROM中。从架构上看,Flite包括两个部分,核心库和声音,Flite库包含核心合成代码。Flite声音,这包含三个子部分(1)语一言模型:字串处理,韵律模型 textprocessing, prosodymodelsete(2)字典不fJ字符到声音规则 Lexieonandxette:tosoundrules(3)单元库和声音定义 unitdat汕 aseandvoicedefinition。
Flite是墓于diphone原理合成的,Diphone合成中所使用的是一种简约语音库,它包括一种语言中出现的所有diphone(汉语中叫做双因素),diphone的数量是基于这种语音的因素的数目,比如:西班牙语有大约800个diphone,德语有2500左右。在diphone合成中,每个dihone只有一个例子是包含在语音库里。在运行时,句子的韵律处理是基于这些最小单位的叠
从flite的介绍中可以看到,它是festival-lite,即festival的精简版,相对于Festival结构过冗余,速度太慢,它是一款短小精悍,快速实时的TTS引擎。Flite设计中兼容Festival的voiees和models,Flite使用HRGS(heterogeneous relation graphs)作为它的基本的发音代表结构。而且合成器的大部分内容是数据,比如字典,单元数据库等(lexicons,unitdatabaseetc),实际的代码量相当的小。对于festival,大部分数据存在在外部文件中,依需要而下载,而对于Flite来说,因为它是非常小的一个引擎,所以允许核心数据在ROM中。从架构上看,Flite包括两个部分,核心库和声音,Flite库包含核心合成代码。Flite声音,这包含三个子部分(1)语一言模型:字串处理,韵律模型 textprocessing, prosodymodelsete(2)字典不fJ字符到声音规则 Lexieonandxette:tosoundrules(3)单元库和声音定义 unitdat汕 aseandvoicedefinition。
Flite是墓于diphone原理合成的,Diphone合成中所使用的是一种简约语音库,它包括一种语言中出现的所有diphone(汉语中叫做双因素),diphone的数量是基于这种语音的因素的数目,比如:西班牙语有大约800个diphone,德语有2500左右。在diphone合成中,每个dihone只有一个例子是包含在语音库里。在运行时,句子的韵律处理是基于这些最小单位的叠