五度字调模型

五度字调模型

语音的声调对合成的语音的自然度和可懂度影响甚大,尤其对于声调语言汉语普通话。五度字调模型旨在生成声调所需要的基频。用来合成汉语各方言的语音。

参考文献:
杨顺安. 五度字调模型在合成汉语语音中的应用[J]. 方言,1987(2),142-147.

五度制标调法

赵元任在1930年提出。

五度音划分:
将声调划分为五类,用1-5数字表示:
5.高
4.半高
3.中
2.半低
1.低

  • 一声:阴平
    55调值( 高平调)
    发音要点:又高又平、有起点有终点、不要虚。

  • 二声:阳平
    35调值 (高升调)
    发音要点:高起高走、平稳上升、结尾保护住。

  • 三声:上声
    214调值 (降升调)
    发音要点:前低后高,前短后长、前轻后重。

  • 四声:去声
    51调值 (全降调)
    发音要点:又高又短

五度制音高标记法:
在这里插入图片描述

五度字调模型

当一个声音的频率由低到高变化时,人们的听觉上,便产生了一种由低到高变化的音高感觉。声音的频率是一种客观的物理量,而声音的音高却是一种主观的心理量,音高感觉是以频率值及其变化为基础的,但两者间呈现着复杂的关系。
在五度制标调法中,采用“相对音高”来描述字音的声调特性,即是某一声调的音高变化是相对于某一基准音高的,是在某一特定音域内,按某种调值变化的,而调值是按五度来划分的。
在这里插入图片描述
五度字调模型表达式:
在这里插入图片描述
fc(t) 称为中值音高:(以常用对数值表示),它体现着嗓音的高低,例如,成年男子的fc可以取2.1,相当于126赫的平均基频(log126=2.1); 女子的fc取为2.4,相当于252赫的平均基频。

fd 表示调域的大小,也以常用对数计。例如,某方言各调中,最高基频为300Hz,最低为150,则fd=log(300/150)=0.3

在汉语普通话中,四种声调的五度值分别为:55,35,51,214

f(t):某一特定声调的调形函数,其值在-0.5到0.5之间。

对升调降调来说,f(t)可用直线方程表示:
fb,fe代表五度值的两个数字。
在这里插入图片描述
比如,调值为55,即fb=5,fe=5。代入上式,可得f(t)=0.5
调值24,即fb=2,fe=4,得f(t)=-0.25+0.5t。

对于曲折调,f(t)可用抛物线方程,用fb, fm, fe三个数字表示五度值:
在这里插入图片描述
对于凹形曲折调,b系数中±号取负号;对凸形调,取正号。例如:
在这里插入图片描述
这样一来,给定了中值音高fc,调域fd,和声调五度值,由此五度字调模型就能生成某种声调的基频随时间变化的数列。

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值