Towards Natural Bilingual ... and Cross-Lingual Voice Conversion-论文梳理

Abstract

  1. 为什么要有后续的两次TTS增强合成
  2. 要凸显先主观使用Cross-Lingual Voice Conversion的理论意义, 统计意义, 结果. 但是论文好像只用了MOS来评测, 并没有用刁难的句子
  3. 论文先用VC, 在经过两次数据增强, 目的没说清楚, 不过也提到了是跨语言的因素覆盖率
  4. 最后的TTS用的是Tacotron, 因此合成的自然度会很高, 高于直接ppg_decode_spec结构
  5. 有的地方用的multi-speaker, 但是大部分用的独自的personal结构
  6. 用的aishell1中文的ASR

1. Introduction

  1. 构建双语和Code-Switch TTS时, 首次结合了CL-VC和CL-TTS,并且使用生成的语料相互增强, 实现了高自然度语音质量和说话者相似性
  2. Tacotron, Transformer, FastSpeech都有涉及, 并且开源代码指向性给出

2. Building Bilingual and Code-Switched TTS

2.0. 核心思路

  1.  One of the keys to building such a TTS with monolingual data is to solve bilingual phonetic coverage [14]. We realize a full bilingual phonetic coverage by crosslingual VC for both speakers, that is, generating the Mandarin speaker’s English speech and the English speaker’s Mandarin speech. Thus, each of the original monolingual corpora is expanded to be bilingual

2.1.1. The PPG

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值