![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
语音合成
文章平均质量分 79
AI强仔
人工智能爱好者、机器人爱好者
展开
-
语音特征:spectrogram、Fbank(fiterbank)、MFCC
语音特征:spectrogram、Fbank(fiterbank)、MFCC原创 2022-12-02 15:07:55 · 2751 阅读 · 0 评论 -
语音识别与语音合成--百度PaddleSpeech
语音识别与语音合成--百度PaddleSpeech翻译 2022-12-01 14:20:28 · 1863 阅读 · 0 评论 -
Arduino播放声音
Arduino播放声音原创 2022-10-10 16:21:54 · 3681 阅读 · 0 评论 -
长语句语音合成--Dynamic Convolution Attention (DCA)
1 简介本文根据2020年《LOCATION-RELATIVE ATTENTION MECHANISMS FOR ROBUST LONG-FORM SPEECH SYNTHESIS》翻译总结的。基于注意力的端到端的text-to-speech (TTS) 系统尽管有能力在域内产生人类水平的语音合成,但在域外文本处理上容易出现文本对齐失败的情况。这些失败很可能是因为采用了简单的location-relative 注意力机制,其废除了基于内容的query/key比较。我们比较了两种注意力机制:locatio翻译 2021-11-21 17:12:34 · 519 阅读 · 0 评论 -
Tacotron2--语音合成
1 简介本文根据2018年《NATURAL TTS SYNTHESIS BY CONDITIONING WAVENET ON MEL SPECTROGRAM PREDICTIONS》翻译总结的。通过标题可以看出来Tacotron 2包括Tacotron 和WAVENET。Tacotron 2是一个可以直接从文本合成语音的神经网络模型。有两部分构成,第一部分是循环序列到序列的特征预测网络,其将字符embedding转换为mel-scale 频谱(SPECTROGRAM);第二部分是修改的WaveNet模型翻译 2021-11-18 23:15:40 · 2402 阅读 · 0 评论