开源语音合成和转换项目

MasonYyp

于 2025-05-03 16:57:42 发布

阅读量314

点赞数 3

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/make_progress/article/details/147685016

版权

开源语音合成和转换项目

大模型出来以后，语音合成和转换方面也有了很大的变化。在语音转换文字方面有Whisper、SeamlessM4T等；在语音合成方面有ChatTTS（中英文）、Orpheus TTS（仅仅支持英文）、Amphion；在语音克隆方面有CosyVoice、Amphion、MegaTTS 3等；为视频添加字幕VideoLingo。

1 语音合成

ChatTTS（中英文）
https://github.com/2noise/ChatTTS

Orpheus TTS（支持英文）
https://github.com/canopyai/Orpheus-TTS

2 语音克隆

CosyVoice（阿里 声音克隆）
https://github.com/FunAudioLLM/CosyVoice?_refluxos=a10

Amphion（声音克隆，生成语言）
https://github.com/open-mmlab/Amphion?_refluxos=a10

字节（声音克隆）
https://github.com/bytedance/MegaTTS3

3 视频字幕

VideoLingo（添加字幕），Netflix级字幕切割、翻译、对齐、甚至加上配音，一键全自动视频搬运AI字幕组
https://github.com/Huanshere/VideoLingo?_refluxos=a10

4 音频转文字

# faster-whisper基于CTranslate2重新优化了whisper，有效提升了whisper的性能
https://github.com/SYSTRAN/faster-whisper

# WhisperX融合faster-whisper提高性能、pyannote-audio区分信号和wav2vec 2.0自动语音识别预训练模型识别语音特征等，
# 实现单词级时间戳的自动语音识别
https://github.com/m-bain/whisperX

博客等级

码龄8年

262
原创

567
点赞

1661
收藏

288
粉丝

关注

私信

热门文章

分类专栏

大模型 1篇
python 16篇
JavaEE 26篇
前端 28篇
微服务 28篇
go 4篇
Hadoop 6篇
Vue 5篇
Android 19篇
Linux服务器 43篇
机器学习 33篇

展开全部收起

上一篇：: 简单使用MCP

下一篇：: 简单使用Slidev和PPTist

最新评论

Python简单使用MinerU
yskany: 那些依赖包都没有，博主能详细一点吗？
Docker安装hoppscotch
weixin_39417183: 大佬，一直在报错Error: Error: auth/provider_not_configured_correctly 2025-05-14 10:34:59 Backend Server | at throwErr (/dist/backend/dist/utils.js:26:11) 2025-05-14 10:34:59 Backend Server | at InfraConfigService.initializeInfraConfigTable (/dist/backend/dist/infra-config/infra-config.service.js:98:38) 2025-05-14 10:34:59 Backend Server | at async InfraConfigService.onModuleInit (/dist/backend/dist/infra-config/infra-config.service.js:54:9)是什么问题呢
Python简单使用MinerU
蓝色的山竹: 直接用程序访问API可以吗？就不用前面那么复杂的下载model了
Python简单使用MinerU
林语微光: 不用申请，可以直接用的
Python简单使用MinerU
凤栖之木: 想问一下这个API怎么申请

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。