详解Attention、Tacotron、WaveNet、LPCNet声码器等前沿方法

作为语音交互的出口,语音合成是语音助手、车载导航、智能音箱、智能玩具、机器人等应用的必备功能,其效果直接影响人机交互的体验。

此外,语音合成在AI音频内容创作与生成上也具有巨大的应用潜力:AI听书、AI电台、虚拟主播等均需要自然流畅、多样化、表现力、个性化的语音合成技术。

 

(语音合成应用) 

语音合成技术虽已广泛落地应用,但要想构建一个语音合成系统,需要涉及多方面系统、专门的知识,包括繁杂的前端文本分析、声学与时长建模、声码器技术等,同时也需要较多的工程经验和长期积累。

很多伙伴在学习语音合成技术时,更多的是通过查阅资料了解前沿技术,而通过论文及博客文章的点式学习,无法构成完整的知识面;同时目前系统性学习语音合成的教程又极为匮乏,系统性讲解动手实践内容的资料更为少见,系统学懂原理极为困难;即使懂了理论原理,由于缺乏系统理解,在实践过程中也不知道从哪里入手,真正落地更是难上加难!

基于此,深蓝学院推出『语音合成:基础与前沿』课程,课程以系统全面的知识讲解和精心设计的动手实践,让语音合成学习者掌握扎实系统的专业知识,同时培养良好的工程实战能力。

 

讲师团队

 

课程大纲

 

(点击查看大图)

 

实践项目

(点击查看大图)

  

学后收获

1. 掌握传统语音合成系统中文本正则化、分词、注音、韵律预测等前端子模块的作用以及基于BLSTM+CRF的方法;

2. 掌握传统语音合成系统中主流后端算法,包括基于HMM/NN的统计参数模型,以及基于单元拼接的方法;

3. 领悟基于Attention的序列到序列算法的思想,掌握Tacotron模型的细节;

4. 深入了解更适合语音任务的Attention机制及其应用;

5. 熟悉基于WaveNet的神经网络声码器以及WaveRNN和LPCNet声码器的原理。

 

还能收获

 

1. 优质的学习圈子

伙伴们大多是来自985、211及海外院校硕博,在这里大家一起学习、进行讨论与研究。独一无二的优质圈子将是你未来学习与就业的宝贵资源。

(学员院校/企业展示)

2. 企业认可的证书

学完课程后将有机会收获优秀学员证书、毕业证书,为你的简历加分添彩。

 

课程服务

1. 三师助力

讲师&助教及时答疑解惑,班主任全程带班督学,帮你克服拖延,不断进步。

 

2. 定期班会

助教1V1批改作业,并在班会中进行讲评和指导;在班会中,学习更多技巧;在交流中收获更多思路。

抢占优惠名额

现在报名,立即优惠100

最后10个优惠名额

备注“ PW  ”,优先咨询哦~

添加客服『叶子』

了解更多课程信息

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值