推荐 3 个火火火的 AI 语音开源项目 !

嗨喽!GitHub科技的各位小伙伴们,由于公众号做了乱序推送改版,为了保证公众号的推文能够第一时间及时送达到大家手上,大家记得将公众号 加星标置顶 ,公众号每天会送上几个GitHub开源项目给大家学习 !

1

   

视频翻译配音

这是一个视频翻译配音工具,可将一种语言的视频翻译为指定语言的视频,自动生成和添加该语言的字幕和配音。

语音识别支持 faster-whisper模型 openai-whisper模型 和 GoogleSpeech zh_recogn阿里中文语音识别模型 。

文字翻译支持 微软翻译|Google翻译|百度翻译|腾讯翻译|ChatGPT|AzureAI|Gemini|DeepL|DeepLX|离线翻译OTT 。

https://github.com/jianchang512/pyvideotrans

e8d252426320dcf82aed5df1fa55ec4e.png

2

   

本地运行语音处理:Sherpa-ONNX

sherpa-ONNX 是一个开源项目,它允许您在本地设备上运行语音处理模型,包括语音识别、语音合成、说话人识别和语音活动检测。它支持多种平台和操作系统,包括 Windows、macOS、Linux、Android 和 iOS,以及多种编程语言,例如 C++、Python、Java 和 C#。

https://github.com/k2-fsa/sherpa-onnx

f751bbc95857ed4a2705273de70d0535.png

3

   

ChatTTS语音克隆

ChatTTS是一款神奇工具,能让你的文字像人一样说话,而且听起来自然真实。这个工具适合用在需要语音合成的场景,比如智能助手、客服机器人,甚至是让你的文章或故事开口说话。

ChatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。

亮点:

  • 对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。

  • 细粒度控制: 该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。

  • 更好的韵律: ChatTTS在韵律方面超越了大部分开源TTS模型。同时提供预训练模型,支持进一步的研究。

https://github.com/2noise/ChatTTS

b121efba9970e9fbce2f8886633706ef.png

--完--



读到这里说明你喜欢本公众号的文章,欢迎 置顶(标星)本公众号 GitHub科技,这样就可以第一时间获取推送了~
在本公众号,后台回复:666,领取一份450个副业指南手册 !
推荐阅读
1. 推荐 3 个 yyds 开源的后端管理系统 !
2. 盘点 3 个惊艳的 GitHub 开源项目 !
3. 推荐 3 个 yyds 的 开源项目 !
4. 推荐 3 个火火火的 GitHub 开源项目 !

觉得内容还不错的话,给我点个“在看”呗
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 一些开源的AI语音项目包括: - TensorFlow Speech Recognition(基于TensorFlow的语音识别) - Kaldi(一个开源工具包,用于语音识别和语音语言处理) - CMU Sphinx(基于深度神经网络的语音识别) - DeepVoice3(用于实现文本到语音转换的深度学习模型) - Mozilla DeepSpeech(用于语音识别的深度学习模型) 这些都是很流行的开源项目, 你可以查看更多的开源项目. ### 回答2: AI语音开源项目有很多,以下是其中几个比较知名的项目: 1. Mozilla DeepSpeech:由Mozilla基金会开发的一个开源项目,旨在实现高准确率的自动语音识别(ASR)技术。 2. Kaldi:Kaldi是一个自由和开源的语音识别工具包,它提供了一种高度可扩展的ASR研究平台。 3. Mycroft:Mycroft是一个开源的智能语音助手项目,类似于Siri或Google Assistant,但是所有的代码都是开放的,并且可以由开发者根据自己的需求进行改进。 4. Rhasspy:Rhasspy是一个开源的离线语音识别工具,旨在为家庭自动化或物联网项目提供一个易于使用且隐私友好的语音控制界面。 5. Jasper:Jasper是一个用于构建自定义语音助手的开源框架,可以用于语音识别、理解和生成等功能。 这些开源项目提供了语音识别、语音合成等功能的实现方法和工具,具有很高的灵活性和可扩展性,开发者可以根据自己的需求进行定制和扩展。这些项目的存在使得使用AI语音技术的开发更加容易和普及,也促进了AI语音领域的进一步发展。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值