Subdomain of Voice Synsthesis 声音合成简介

最新推荐文章于 2025-05-16 14:05:46 发布

Swaggy_Yhy

最新推荐文章于 2025-05-16 14:05:46 发布

阅读量1k

点赞数

文章标签：人工智能深度学习机器学习音频

本文链接：https://blog.csdn.net/SwaggyYhy/article/details/129560669

版权

声音合成子领域

1. TTS: Text-to-Speech
文字转语音，比如特朗普讲中文，需要利用声音的频谱特征训练。
2. SVS: Singing Voice Synthesis
歌声合成，更有挑战性的任务，比如让特朗普唱歌。因为要把歌唱准需要更多细节信息，比如要利用声音的基音频率f0，也就是歌声的旋律是什么音，这是保证唱歌旋律能唱准。
3. SVC: Sing Voice Conversion
歌声转换，个人理解就是音色的迁移。比如说让陶喆唱不能说的秘密，本质是把周杰伦这首歌的音色特征变成陶喆的音色特征。

相关商业公司

以下介绍来自Bing

VOCALOID

VOCALOID是雅马哈公司开发的电子音乐制作语音合成软件，输入音调和歌词，就可以合成为原为人类声音的歌声¹²。VOCALOID的名字，是由「vocal（歌唱）」与后缀「-oid」结合构成的³。目前最新的版本是VOCALOID6，它使用了基于AI的技术，提供了更自然的歌唱表现⁴。
(1) VOCALOID. https://air.moe/VOCALOID/index.html 访问时间 2023/3/15.
(2) VOCALOID - 維基百科，自由的百科全書. https://zh.wikipedia.org/zh-tw/VOCALOID 访问时间 2023/3/15.
(3) VOCALOID - 萌娘百科万物皆可萌的百科全书. https://zh.moegirl.org.cn/Vocaloid 访问时间 2023/3/15.
(4) VOCALOID - the modern singing synthesizer. https://www.vocaloid.com/en/ 访问时间 2023/3/15.

CeVIO

CeVIO是一个由多家企业组成的专案，开发了一种新型的语音和歌唱合成软件¹²。CeVIO的名字是由英文单词"VOICE"重组而成²。CeVIO使用了基于深度神经网络的技术，可以合成自然的语音和歌唱³。CeVIO最新的版本是CeVIO AI，它提供了多种声库，包括一些新的角色，如樱花乐音、星之海凛、鹿乃等³。
(1) CeVIO - 萌娘百科万物皆可萌的百科全书. https://zh.moegirl.org.cn/CeVIO 访问时间 2023/3/15.
(2) CeVIO - 维基百科，自由的百科全书. https://zh.wikipedia.org/wiki/CeVIO 访问时间 2023/3/15.
(3) CeVIO AI新手入门教程第一期——初步上手 - 哔哩哔哩. https://www.bilibili.com/read/cv13157789 访问时间 2023/3/15.
(4) cevio、voiceroid和Megpoid Talk有何比较？ - 知乎. https://www.zhihu.com/question/41568543 访问时间 2023/3/15.

Synthesizer V（SV）

Synthesizer V是一种先进的歌唱合成软件，由Dreamtonics公司开发¹。Synthesizer V可以忠实地复制人类歌声的细微差别，而不限制你的词汇¹。Synthesizer V支持英文、中文和日文的歌唱²。Synthesizer V使用了基于混合人工神经网络和拼接合成的技术，可以从少量样本中生成自然和清晰的声音²。Synthesizer V还使用了一种专利的低层次语音模型（LLSM），可以调整声音的音色、音高、强度等参数²。
(1) Synthesizer V | Dreamtonics株式会社. https://dreamtonics.com/synthesizerv/ 访问时间 2023/3/15.
(2) Synthesizer V - Official Website - Dreamtonics. https://dreamtonics.com/synthesizerv-gen1/ 访问时间 2023/3/15.
(3) Web Synthesizer V | Synthesizer V - Official Website. https://synthesizerv.com/web/ 访问时间 2023/3/15.

ACE Studio

ACE Studio是一款易用而强大的AI歌声合成软件，由北京时域科技有限公司开发。²³
ACE Studio可以让你用简单的操作，就能让AI虚拟歌姬为你演唱任何歌曲，无论是中文还是英文。¹²
ACE Studio目前有四个声库：何畅、王琳、李悦和陈婧，每个声库都有自己的特点和风格。²³
ACE Studio还有很多其他的功能，比如自动扒midi、调音、混音等，可以让你轻松地创作出高质量的作品。³
(1) ACE Virtual Singer | Vocal Synthesizer Wiki | Fandom. https://vocalsynth.fandom.com/wiki/ACE_Virtual_Singer 访问时间 2023/3/15.
(2) 【ACE Studio】易用而强大的「Windows/macOS端」AI歌声合成软件丨内测申请开启. https://www.bilibili.com/video/BV13u411e7S1/ 访问时间 2023/3/15.
(3) ACE Studio timedomAIn (@ATimedomain) / Twitter. https://twitter.com/ATimedomain 访问时间 2023/3/15.

X Studio

X Studio是一款免费的AI歌声合成软件，由微软小冰团队开发。¹²⁴
X Studio可以让你用AI虚拟歌手为你演唱任何歌曲，无论是中文还是英文。²⁴
X Studio目前有三个声库：绮萱、小冰和小娜，每个声库都有自己的音色和唱腔。¹²
X Studio的特点是需要在服务端合成，并且声音接近人声。²⁵
X Studio还有很多其他的功能，比如自动扒谱、调音、混音等，可以让你轻松地创作出高质量的作品。⁴
(1) X Studio · 歌手 - 萌娘百科万物皆可萌的百科全书. https://zh.moegirl.org.cn/X_Studio_%C2%B7_%E6%AD%8C%E6%89%8B 访问时间 2023/3/15.
(2) 简单试用 X Studio·歌手后的感受 - 哔哩哔哩. https://www.bilibili.com/read/cv15606246 访问时间 2023/3/15.
(3) X Studio. https://singer.xiaoice.com/ 访问时间 2023/3/15.
(4) 如何评价微软小冰人工智能歌手X Studio？ - 知乎. https://www.zhihu.com/question/417112703 访问时间 2023/3/15.
(5) The X Studio. https://thexstudio.io/ 访问时间 2023/3/15.