31Seen and Unseen emotional style transfer for voice conversion with a new emotional speech dataset


前言

原文地址—2020

一、文章内容

  • 文章想法:

    • 整了个新的数据集实现感情风格转换
    • 使用了一个变异自编码器这么一个模型进行感情风格变换
    • 干净的声音本身划分为三部分,内容、个人的特征、其他的语音语调等,文章就是在保证语言内容和个人特征不变的情况下改变其他的语音语调信息来改变感情的表达状态
    • 模型能够实现感情的随意转换,不是特定的1:1转换
    • 实现了声音特征的分离和合并,为语音的识别,说话人识别,感情识别,语音合成提高了一种方案
  • 输入数据

  • 文章模型:
    在这里插入图片描述

  • 训练方式

  • 模型输出

  • 实验结果

  • 文章结论

二、文章总结

  • 文章novel和优势:
    • 进行语音成分分解学习其中的感情特征等信息
    • 利用对抗生成自动学习有用的感情信息
  • 同其他文章比较的劣势:
    • 感情识别的时候单独使用了一个模块进行感情分类,进行了预训练,这个模块本身精确度不是很高影响结果
    • 提取纯语音内容特征的和感情无关特征的时候会方法不是很纯会影响效果

三、相关代码

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不被定义的号

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值