![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
语音合成
forwiat
脚踏实地,仰望星空
展开
-
【机器学习】【seq2seq模型与attention机制,Beam Search】
Beam Search一张图来表示贪心的做法:每次选择输出概率最大的那个单词,但是这样无法保证最终整体概率最大;而集束搜索每次会选择Beam个概率最大的单词(Beam表示每次选择单词数,本例中为3),然后进行下一步...直到最后会得到Beam个句子,挑出概率最大的那句就可以了。seq2seq模型依赖于encode和decode两个模块。encoder用于对输入序列编码,decorder...原创 2018-08-28 22:30:52 · 3756 阅读 · 6 评论 -
【机器学习】【Deep Residual Learning】
本文转自:http://jermmy.xyz/2017/09/25/2017-9-25-paper-notes-deep-residual-learning/,觉得作者写的很好,也注意到是作者自己开发的一个总结学习的一个web系统,怕作者关服务器后,想看再也看不到了的情况= = 所以厚着脸贴了过来。若有冒犯,立刻删除。Deep Residual Learning深度神经网络在训练过程中容易...转载 2018-08-29 22:51:28 · 419 阅读 · 0 评论 -
【机器学习】【Highway Network】
文章转自:https://zhuanlan.zhihu.com/p/35019701原文链接:Highway Networks(2015)传统神经网络,一般对输入做一个非线性变换H来得到输出output:x表示输入,W_H表示权重。而高速公路网络基于门机制,引入了transform gata T和carry gate C,输出由两个门来控制:设置C=1-T,公式就变成了...转载 2018-08-30 15:01:05 · 3792 阅读 · 0 评论 -
【机器学习】【DTW】
转自:https://blog.csdn.net/zouxy09/article/details/9140207一、概述 在大部分的学科中,时间序列是数据的一种常见表示形式。对于时间序列处理来说,一个普遍的任务就是比较两个序列的相似性。在时间序列中,我们通常需要比较两端音频的差异。而这两段音频的长度大部分是不相等的。在语音处理领域上表现为不同人的语速不同。即时同一个人不同一...转载 2018-09-10 17:44:37 · 29411 阅读 · 4 评论 -
【语音合成】merlin学习总结
merlin项目:https://github.com/CSTR-Edinburgh/merlinMTTS的front-end:https://github.com/Jackiexiao/MTTSCSRT官方blogs:https://cstr-edinburgh.github.io/install-merlin/merlin之disccuss:https://github.com/C...原创 2018-09-28 15:59:10 · 1390 阅读 · 0 评论