十个以下特征便可生成一个语音

一个话音由不同频率波组成,更主要是频率改变的状态所表现的(称其为特征)组成,并且不一定是连续的但是有规律的。反过来生成一个语音,只要有规律地出现类正弦波数据,并规律改变波状态,不同规律则会是不同的声音,大多数的人讲话的语音的这个变化是有一定范围的,这就是几个特征便可以生成一个语音,端到端地学习征,不须要大数据超复杂算法,只对每一个语音去提取其中变化的规则的特征,与之对应生成(或者说还原)规律变化的波形数据。语音(特征)与字对应的识别,正在研究。

本人学历低,只能用图说话。

黑色是录取得(粤语‘饼’字)语音数据,红色是去丢高频数。下图的下部分是基于上图数据获得特征值直接输生成,

生成音时长是可调的与原音时长是不同。下图的上部数据是基于获得的特征数据,调整过编入去生成,播放出来的

郊果,原音与两个生成音大至相同。

 

上面第三个生成的语声与前两个相比,象是上了年纪有点宏厚语声。

若想知道效果是什么程度。我有一个App在百度网盘上,是出于好奇将字句编成说唱声来的app.若好奇可下载体验。

声明:本App是我边研究,边更改重编测试软件,或有漏洞故障,只是想说明用几个特征可生成一个语音,在App里

面有大部分汉字对应的普通话音和粤语音的特征记录,同一音的特征会有多个同音汉字,说话音的时长可编长短,说

话人可选年少或年长些的,是男是女暂时还在研究。到这下载https://pan.baidu.com/s/1ZT-L-K6zE0SI12MGcD-LHA

提取码:meee

啰哩啰唆只想说明的是,语声主成,并非要由大数据复杂的算法才学习得到,不同语种的单个音与几个特征对应,几个单音又组成字词,它不须要每一语种都要大量数据学习才得出参数,并生成语音也是大概率下单调声,或者清析些,但决少灵活的张池缓急,长短说唱的要求。

       下图是由原数据(黑色)提取主要频率在其本位置上编写半波数据红色部分,将其播放,郊果与原音大至相同(即使只用大

于0的数据下图2),只是音质有相差,   

lu

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值