TTS模型汇总，强烈建议收藏，内推模型全部经过本人实测有效

AI逍遥子

于 2024-08-03 04:28:17 发布

阅读量306

点赞数 11

文章标签：人工智能 chatgpt python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ab_910256/article/details/140883927

版权

TTS模型汇总：

1、GPT-SoVITS

简介：AI 卖货主播大模型Streamer-Sales销冠用的这款TTS模型。
支持语言：英语、日语、中文。
特点：零样本文本到语音（TTS），集成工具包。
GitHub：GitHub - RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning)
相关链接：https://x.com/aigclink/status/1805405022932681139

2、Fish Speech v1.2

效果：效果稳定且非常好，支持克隆语音。
训练数据：经过30万小时的英语、中文和日语音频数据训练。
模型：https://huggingface.co/fishaudio/fish-speech-1.2
在线版：https://fish.audio/zh-CN/

3、字节的Seed-TTS（不开源）

支持语言：多种语言，包括英语、中文。
功能：同语言生成和跨语言生成，处理各种文本（叙述性、情感表达、描述性等），能根据不同情感和语境生成相应语音。
项目：Seed-TTS

4、ChatTTS

类型：对话式 TTS（可多人）。
支持语言：中英文。
特点：韵律细腻。
GitHub：GitHub - 2noise/ChatTTS: A generative speech model for daily dialogue.
模型：https://huggingface.co/2Noise/ChatTTS/tree/main

5、HuggingFace的Parler-TTS

功能：控制音调、速度、性别、噪音水平、情绪特征等。
GitHub：GitHub - huggingface/parler-tts: Inference and training library for high-quality TTS models.
模型：https://huggingface.co/parler-tts

6、MetaVoice-1B

支持语言：多语言，特别在英语处理上实现了情感语音节奏。
GitHub：GitHub - metavoiceio/metavoice-src: Foundational model for human-like, expressive TTS

7、MARS5-TTS

应用场景：为体育解说、动漫等韵律复杂和多样化的场景生成语音。
GitHub：GitHub - Camb-ai/MARS5-TTS: MARS5 speech model (TTS) from CAMB.AI

8、OpenVoice

支持语言：原生支持英语、西班牙语、法语、中文、日语和韩语。
特点：具有灵活的语音风格控制和零样本跨语言语音克隆能力。
GitHub：GitHub - myshell-ai/OpenVoice: Instant voice cloning by MyShell.

9、EmotiVoice

支持语言：中英文双语。
特点：包含2000多种不同的音色。
GitHub：

关注

11
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
TTS模型汇总，强烈建议收藏，内推模型全部经过本人实测有效

TTS模型汇总：
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。