较好的开源语音大模型【输入】

太屋大叔

已于 2023-12-22 16:20:26 修改

阅读量445

点赞数 9

分类专栏：人工智能文章标签： ai 人工智能机器学习

于 2023-12-22 16:15:39 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36494506/article/details/135155751

版权

人工智能专栏收录该内容

2 篇文章 0 订阅

订阅专栏

DeepSpeech：

由 Mozilla 开发的开源语音识别（ASR）引擎。它基于深度学习技术，使用大量的语音数据进行训练，可以在多种语言和平台上运行。

GitHub 仓库：https://github.com/mozilla/DeepSpeech

Kaldi：

一个广泛使用的开源语音识别工具包，提供了丰富的工具和库，用于构建自定义的语音识别系统。Kaldi 支持多种语音识别任务，包括语音识别、说话人识别等。

官方网站：http://kaldi-asr.org/

OpenSeq2Seq：

由 NVIDIA 开发的开源深度学习工具包，用于语音识别和其他序列到序列（seq2seq）任务。OpenSeq2Seq 提供了多个预训练的语音识别模型，可以进行自定义训练和推理。

GitHub 仓库：https://github.com/NVIDIA/OpenSeq2Seq

ESPnet：

一个端到端的语音处理工具包，支持多种语音任务，包括语音识别、语音合成等。ESPnet 提供了多个预训练的模型，同时也支持自定义模型训练。

GitHub 仓库：https://github.com/espnet/espnet

关注

9
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
较好的开源语音大模型【输入】

由 Mozilla 开发的开源语音识别（ASR）引擎。它基于深度学习技术，使用大量的语音数据进行训练，可以在多种语言和平台上运行。GitHub 仓库：https://github.com/mozilla/DeepSpeech。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。