LiveVideoStack线上分享第五季(九):语音合成中的风格控制

目前,语音合成领域的风格情感控制是一个比较热门的话题,它将决定着语音合成中的似人度和灵活性以及可转换性。5月4日晚 20:00LiveVideoStack线上分享第五季,第八期,我们邀请到了喜马拉雅 音频算法工程师 贺雯迪分享语音合成的基本模块以及风格迁移的概念,详解基于Multihead-Attention的Global style token算法原理以及现在目前比较值得探索的变分自编码器在语音合成中对说话人风格控制的应用。

嘉宾简介

贺雯迪 喜马拉雅 音频算法工程师

爱丁堡大学人工智能硕士,喜马拉雅音频算法工程师。研发经历:TTS前端模块(文本正则、分词算法、韵律预测等),后端算法(基于深度生成模型VAE的说话人风格控制、音色转换、音色克隆、few-shot learning、神经声码器的优化等)。

关于LiveVideoStack线上交流分享

为了给大家提供一个学习,交流的平台,畅聊音视频技术开发新趋势,新实践。我们推出了LiveVideoStack线上交流分享活动,邀请业内资深技术专家进行线上分享技术干货,解答热点问题。你可以通过以下方式参与:

  • 扫描图中二维码关注LiveVideoStack公众号【livevideostack

  • 回复“分享”,即可获得进入直播群的方式

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值