LiveVideoStack线上分享第五季（九）：语音合成中的风格控制

最新推荐文章于 2023-10-23 18:20:39 发布

LiveVideoStack_

最新推荐文章于 2023-10-23 18:20:39 发布

阅读量505

点赞数

目前，语音合成领域的风格情感控制是一个比较热门的话题，它将决定着语音合成中的似人度和灵活性以及可转换性。5月4日晚 20：00，LiveVideoStack线上分享第五季，第八期，我们邀请到了喜马拉雅音频算法工程师贺雯迪分享语音合成的基本模块以及风格迁移的概念，详解基于Multihead-Attention的Global style token算法原理以及现在目前比较值得探索的变分自编码器在语音合成中对说话人风格控制的应用。

嘉宾简介

贺雯迪喜马拉雅音频算法工程师

爱丁堡大学人工智能硕士，喜马拉雅音频算法工程师。研发经历：TTS前端模块（文本正则、分词算法、韵律预测等），后端算法（基于深度生成模型VAE的说话人风格控制、音色转换、音色克隆、few-shot learning、神经声码器的优化等）。

关于LiveVideoStack线上交流分享

为了给大家提供一个学习，交流的平台，畅聊音视频技术开发新趋势，新实践。我们推出了LiveVideoStack线上交流分享活动，邀请业内资深技术专家进行线上分享技术干货，解答热点问题。你可以通过以下方式参与：

扫描图中二维码关注LiveVideoStack公众号【livevideostack】
回复“分享”，即可获得进入直播群的方式

LiveVideoStack_

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
LiveVideoStack线上分享第五季（九）：语音合成中的风格控制

目前，语音合成领域的风格情感控制是一个比较热门的话题，它将决定着语音合成中的似人度和灵活性以及可转换性。5月4日晚20：00，LiveVideoStack线上分享第五季，第八期，我们邀...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。