TTS模型汇总:
1、GPT-SoVITS
- 简介:AI 卖货主播大模型Streamer-Sales销冠用的这款TTS模型。
- 支持语言:英语、日语、中文。
- 特点:零样本文本到语音(TTS),集成工具包。
- GitHub:GitHub - RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning)
- 相关链接:https://x.com/aigclink/status/1805405022932681139
2、Fish Speech v1.2
- 效果:效果稳定且非常好,支持克隆语音。
- 训练数据:经过30万小时的英语、中文和日语音频数据训练。
- 模型:https://huggingface.co/fishaudio/fish-speech-1.2
- 在线版:https://fish.audio/zh-CN/
3、字节的Seed-TTS(不开源)
- 支持语言:多种语言,包括英语、中文。
- 功能:同语言生成和跨语言生成,处理各种文本(叙述性、情感表达、描述性等),能根据不同情感和语境生成相应语音。
- 项目:Seed-TTS
4、ChatTTS
- 类型:对话式 TTS(可多人)。
- 支持语言:中英文。
- 特点:韵律细腻。
- GitHub:GitHub - 2noise/ChatTTS: A generative speech model for daily dialogue.
- 模型:https://huggingface.co/2Noise/ChatTTS/tree/main
5、HuggingFace的Parler-TTS
- 功能:控制音调、速度、性别、噪音水平、情绪特征等。
- GitHub:GitHub - huggingface/parler-tts: Inference and training library for high-quality TTS models.
- 模型:https://huggingface.co/parler-tts
6、MetaVoice-1B
- 支持语言:多语言,特别在英语处理上实现了情感语音节奏。
- GitHub:GitHub - metavoiceio/metavoice-src: Foundational model for human-like, expressive TTS
7、MARS5-TTS
- 应用场景:为体育解说、动漫等韵律复杂和多样化的场景生成语音。
- GitHub:GitHub - Camb-ai/MARS5-TTS: MARS5 speech model (TTS) from CAMB.AI
8、OpenVoice
- 支持语言:原生支持英语、西班牙语、法语、中文、日语和韩语。
- 特点:具有灵活的语音风格控制和零样本跨语言语音克隆能力。
- GitHub:GitHub - myshell-ai/OpenVoice: Instant voice cloning by MyShell.
9、EmotiVoice
- 支持语言:中英文双语。
- 特点:包含2000多种不同的音色。
- GitHub: