Subdomain of Voice Synsthesis 声音合成简介

声音合成子领域

1. TTS: Text-to-Speech
文字转语音,比如特朗普讲中文,需要利用声音的频谱特征训练。
2. SVS: Singing Voice Synthesis
歌声合成,更有挑战性的任务,比如让特朗普唱歌。因为要把歌唱准需要更多细节信息,比如要利用声音的基音频率f0,也就是歌声的旋律是什么音,这是保证唱歌旋律能唱准。
3. SVC: Sing Voice Conversion
歌声转换,个人理解就是音色的迁移。比如说让陶喆唱不能说的秘密,本质是把周杰伦这首歌的音色特征变成陶喆的音色特征。

相关商业公司

以下介绍来自Bing

VOCALOID

VOCALOID是雅马哈公司开发的电子音乐制作语音合成软件,输入音调和歌词,就可以合成为原为人类声音的歌声¹²。VOCALOID的名字,是由「vocal(歌唱)」与后缀「-oid」结合构成的³。目前最新的版本是VOCALOID6,它使用了基于AI的技术,提供了更自然的歌唱表现⁴。
(1) VOCALOID. https://air.moe/VOCALOID/index.html 访问时间 2023/3/15.
(2) VOCALOID - 維基百科,自由的百科全書. https://zh.wikipedia.org/zh-tw/VOCALOID 访问时间 2023/3/15.
(3) VOCALOID - 萌娘百科 万物皆可萌的百科全书. https://zh.moegirl.org.cn/Vocaloid 访问时间 2023/3/15.
(4) VOCALOID - the modern singing synthesizer. https://www.vocaloid.com/en/ 访问时间 2023/3/15.

CeVIO

CeVIO是一个由多家企业组成的专案,开发了一种新型的语音和歌唱合成软件¹²。CeVIO的名字是由英文单词"VOICE"重组而成²。CeVIO使用了基于深度神经网络的技术,可以合成自然的语音和歌唱³。CeVIO最新的版本是CeVIO AI,它提供了多种声库,包括一些新的角色,如樱花乐音星之海凛鹿乃等³。
(1) CeVIO - 萌娘百科 万物皆可萌的百科全书. https://zh.moegirl.org.cn/CeVIO 访问时间 2023/3/15.
(2) CeVIO - 维基百科,自由的百科全书. https://zh.wikipedia.org/wiki/CeVIO 访问时间 2023/3/15.
(3) CeVIO AI新手入门教程第一期——初步上手 - 哔哩哔哩. https://www.bilibili.com/read/cv13157789 访问时间 2023/3/15.
(4) cevio、voiceroid和Megpoid Talk有何比较? - 知乎. https://www.zhihu.com/question/41568543 访问时间 2023/3/15.

Synthesizer V(SV)

Synthesizer V是一种先进的歌唱合成软件,由Dreamtonics公司开发¹。Synthesizer V可以忠实地复制人类歌声的细微差别,而不限制你的词汇¹。Synthesizer V支持英文、中文和日文的歌唱²。Synthesizer V使用了基于混合人工神经网络和拼接合成的技术,可以从少量样本中生成自然和清晰的声音²。Synthesizer V还使用了一种专利的低层次语音模型(LLSM),可以调整声音的音色、音高、强度等参数²。
(1) Synthesizer V | Dreamtonics株式会社. https://dreamtonics.com/synthesizerv/ 访问时间 2023/3/15.
(2) Synthesizer V - Official Website - Dreamtonics. https://dreamtonics.com/synthesizerv-gen1/ 访问时间 2023/3/15.
(3) Web Synthesizer V | Synthesizer V - Official Website. https://synthesizerv.com/web/ 访问时间 2023/3/15.

ACE Studio

ACE Studio是一款易用而强大的AI歌声合成软件,由北京时域科技有限公司开发。²³
ACE Studio可以让你用简单的操作,就能让AI虚拟歌姬为你演唱任何歌曲,无论是中文还是英文。¹²
ACE Studio目前有四个声库:何畅、王琳、李悦和陈婧,每个声库都有自己的特点和风格。²³
ACE Studio还有很多其他的功能,比如自动扒midi、调音、混音等,可以让你轻松地创作出高质量的作品。³
(1) ACE Virtual Singer | Vocal Synthesizer Wiki | Fandom. https://vocalsynth.fandom.com/wiki/ACE_Virtual_Singer 访问时间 2023/3/15.
(2) 【ACE Studio】易用而强大的「Windows/macOS端」AI歌声合成软件丨内测申请开启. https://www.bilibili.com/video/BV13u411e7S1/ 访问时间 2023/3/15.
(3) ACE Studio timedomAIn (@ATimedomain) / Twitter. https://twitter.com/ATimedomain 访问时间 2023/3/15.

X Studio

X Studio是一款免费的AI歌声合成软件,由微软小冰团队开发。¹²⁴
X Studio可以让你用AI虚拟歌手为你演唱任何歌曲,无论是中文还是英文。²⁴
X Studio目前有三个声库:绮萱、小冰和小娜,每个声库都有自己的音色和唱腔。¹²
X Studio的特点是需要在服务端合成,并且声音接近人声。²⁵
X Studio还有很多其他的功能,比如自动扒谱、调音、混音等,可以让你轻松地创作出高质量的作品。⁴
(1) X Studio · 歌手 - 萌娘百科 万物皆可萌的百科全书. https://zh.moegirl.org.cn/X_Studio_%C2%B7_%E6%AD%8C%E6%89%8B 访问时间 2023/3/15.
(2) 简单试用 X Studio·歌手后的感受 - 哔哩哔哩. https://www.bilibili.com/read/cv15606246 访问时间 2023/3/15.
(3) X Studio. https://singer.xiaoice.com/ 访问时间 2023/3/15.
(4) 如何评价微软小冰人工智能歌手X Studio? - 知乎. https://www.zhihu.com/question/417112703 访问时间 2023/3/15.
(5) The X Studio. https://thexstudio.io/ 访问时间 2023/3/15.

学习路线

1. Awesome Singing Voice Synthesis and Singing Voice Conversion

这是github上一个项目,汇总了SVCSVS方向的前沿成果,包括论文、代码。
![[Pasted image 20230315155920.png]]
guan-yuan/Awesome-Singing-Voice-Synthesis-and-Singing-Voice-Conversion: A paper
and project list about the cutting edge Speech Synthesis, Text-to-Speech (TTS), Singing Voice Synthesis (SVS), Voice Conversion (VC), Singing Voice Conversion (SVC), and related interesting works (such as Music Synthesis, Automatic Music Transcription, Automatic MOS Prediction, SSL-based ASR…etc). (github.com)

2. DiffSinger

D i f f S i n g e r DiffSinger DiffSinger 是浙江大学的语音合成项目,论文:
D i f f S i n g e r : S i n g i n g V o i c e S y n t h e s i s v i a S h a l l o w D i f f u s i o n M e c h a n i s m DiffSinger: Singing \quad Voice\quad Synthesis\quad via\quad Shallow\quad Diffusion\quad Mechanism DiffSinger:SingingVoiceSynthesisviaShallowDiffusionMechanism
该论文发表在 A A A I 2022 AAAI\quad2022 AAAI2022 ,链接为DiffSinger Paper
github项目地址:MoonInTheRiver/DiffSinger: DiffSinger: Singing Voice Synthesis via Shallow Diffusion Mechanism (SVS & TTS); AAAI 2022; Official code (github.com)

相关教程、工具、项目链接:
浙江大学DiffSinger项目
OpenVPI DiffSinger项目
OpenVPI DiffSinger原始教程
OpenSVIP工程转换器项目
OpenVPI DiffSinger社区声码器企划
OpenCPOP开源数据集
M4Singer开源数据集
OpenAI Whisper
OpenUTAU DiffSingerPack
@Well404 的切分标注工具 
@冷月2333 音频预处理
@冷月2333 声码器增强
OpenVPI DiffSinger 交流群:907879266
OpenUTAU 交流群:485658015

参考视频

@散沙PythonPlayer

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值