五度字调模型
语音的声调对合成的语音的自然度和可懂度影响甚大,尤其对于声调语言汉语普通话。五度字调模型旨在生成声调所需要的基频。用来合成汉语各方言的语音。
参考文献:
杨顺安. 五度字调模型在合成汉语语音中的应用[J]. 方言,1987(2),142-147.
五度制标调法
赵元任在1930年提出。
五度音划分:
将声调划分为五类,用1-5数字表示:
5.高
4.半高
3.中
2.半低
1.低
-
一声:阴平
55调值( 高平调)
发音要点:又高又平、有起点有终点、不要虚。 -
二声:阳平
35调值 (高升调)
发音要点:高起高走、平稳上升、结尾保护住。 -
三声:上声
214调值 (降升调)
发音要点:前低后高,前短后长、前轻后重。 -
四声:去声
51调值 (全降调)
发音要点:又高又短
五度制音高标记法:
五度字调模型
当一个声音的频率由低到高变化时,人们的听觉上,便产生了一种由低到高变化的音高感觉。声音的频率是一种客观的物理量,而声音的音高却是一种主观的心理量,音高感觉是以频率值及其变化为基础的,但两者间呈现着复杂的关系。
在五度制标调法中,采用“相对音高”来描述字音的声调特性,即是某一声调的音高变化是相对于某一基准音高的,是在某一特定音域内,按某种调值变化的,而调值是按五度来划分的。
五度字调模型表达式:
fc(t) 称为中值音高:(以常用对数值表示),它体现着嗓音的高低,例如,成年男子的fc可以取2.1,相当于126赫的平均基频(log126=2.1); 女子的fc取为2.4,相当于252赫的平均基频。
fd 表示调域的大小,也以常用对数计。例如,某方言各调中,最高基频为300Hz,最低为150,则fd=log(300/150)=0.3
在汉语普通话中,四种声调的五度值分别为:55,35,51,214
f(t):某一特定声调的调形函数,其值在-0.5到0.5之间。
对升调降调来说,f(t)可用直线方程表示:
fb,fe代表五度值的两个数字。
比如,调值为55,即fb=5,fe=5。代入上式,可得f(t)=0.5
调值24,即fb=2,fe=4,得f(t)=-0.25+0.5t。
对于曲折调,f(t)可用抛物线方程,用fb, fm, fe三个数字表示五度值:
对于凹形曲折调,b系数中±号取负号;对凸形调,取正号。例如:
这样一来,给定了中值音高fc,调域fd,和声调五度值,由此五度字调模型就能生成某种声调的基频随时间变化的数列。