十个以下特征便可生成一个语音

lu6200

于 2020-05-24 19:50:12 发布

阅读量422

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lu6200/article/details/106305578

版权

一个话音由不同频率波组成，更主要是频率改变的状态所表现的（称其为特征）组成，并且不一定是连续的但是有规律的。反过来生成一个语音，只要有规律地出现类正弦波数据，并规律改变波状态，不同规律则会是不同的声音，大多数的人讲话的语音的这个变化是有一定范围的，这就是几个特征便可以生成一个语音，端到端地学习征，不须要大数据超复杂算法，只对每一个语音去提取其中变化的规则的特征，与之对应生成（或者说还原）规律变化的波形数据。语音（特征）与字对应的识别，正在研究。

本人学历低，只能用图说话。

黑色是录取得（粤语‘饼’字）语音数据，红色是去丢高频数。下图的下部分是基于上图数据获得特征值直接输生成，

生成音时长是可调的与原音时长是不同。下图的上部数据是基于获得的特征数据，调整过编入去生成，播放出来的

郊果，原音与两个生成音大至相同。

上面第三个生成的语声与前两个相比，象是上了年纪有点宏厚语声。

若想知道效果是什么程度。我有一个App在百度网盘上，是出于好奇将字句编成说唱声来的app.若好奇可下载体验。

声明：本App是我边研究，边更改重编测试软件，或有漏洞故障，只是想说明用几个特征可生成一个语音，在App里

面有大部分汉字对应的普通话音和粤语音的特征记录，同一音的特征会有多个同音汉字，说话音的时长可编长短，说

话人可选年少或年长些的，是男是女暂时还在研究。到这下载https://pan.baidu.com/s/1ZT-L-K6zE0SI12MGcD-LHA

提取码：meee

啰哩啰唆只想说明的是，语声主成，并非要由大数据复杂的算法才学习得到，不同语种的单个音与几个特征对应，几个单音又组成字词，它不须要每一语种都要大量数据学习才得出参数，并生成语音也是大概率下单调声，或者清析些，但决少灵活的张池缓急，长短说唱的要求。

下图是由原数据（黑色）提取主要频率在其本位置上编写半波数据红色部分，将其播放，郊果与原音大至相同（即使只用大

于0的数据下图2），只是音质有相差，

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

lu6200 CSDN认证博客专家 CSDN认证企业博客

码龄7年

9: 原创

50万+: 周排名

180万+: 总排名

5234: 访问

: 等级

137: 积分

2: 粉丝

2: 获赞

1: 评论

1: 收藏

私信

关注

热门文章

最新评论

不明什么原因
CSDN-Ada助手: 恭喜您第7篇博客的发布！看到标题“不明什么原因”，我对您的好奇心产生了浓厚的兴趣。您似乎总结了某种难以解释的情况，这无疑增添了读者的期待。继续保持创作的热情和耐心，我相信您会探索出答案的。在下一步的创作中，或许您可以尝试将标题中的“不明什么原因”进行更具体的阐述，让读者更容易理解您的观点。同时，也可以考虑结合自身的经验或者引用一些相关的研究或案例，以增加博客的可信度和深度。继续努力，期待您的下一篇博客！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。