RealtimeSTT：实时语音转文字的开源项目

最新推荐文章于 2025-03-21 16:00:00 发布

林泽炯

最新推荐文章于 2025-03-21 16:00:00 发布

阅读量929

点赞数 4

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gitblog_00085/article/details/145023161

版权

RealtimeSTT：实时语音转文字的开源项目

RealtimeSTT A robust, efficient, low-latency speech-to-text library with advanced voice activity detection, wake word activation and instant transcription. 项目地址: https://gitcode.com/gh_mirrors/re/RealtimeSTT

1. 项目基础介绍

RealtimeSTT 是一个使用 Python 编写的开源项目，旨在为实时应用提供低延迟的语音转文字功能。该项目基于先进的声音活动检测、唤醒词激活和即时转录技术，能够将语音实时转换为文字。

2. 核心功能

声音活动检测：自动检测用户何时开始和停止说话。
实时转录：将语音实时转换成文字。
唤醒词激活：可以通过检测特定的唤醒词来激活。
易于使用的接口：提供简洁的接口，方便开发者集成和使用。

3. 最近更新的功能

新的 AudioToTextRecorderClient 类：该类可以自动启动一个服务器（如果没有正在运行的服务器）并连接到它。这个类和 AudioToTextRecorder 类有相同的接口，使得升级或切换变得容易。
改进的命令行界面：使用 "stt-server" 来启动服务器，使用 "stt" 来启动客户端。更多的信息可以在 "server" 文件夹中找到。

请注意，目前项目仍在进行中，AudioToTextRecorderClient 类实现了 AudioToTextRecorder 的许多参数和回调，但还未完全实现。同时，服务器还不能处理并发的（并行的）请求。

RealtimeSTT A robust, efficient, low-latency speech-to-text library with advanced voice activity detection, wake word activation and instant transcription. 项目地址: https://gitcode.com/gh_mirrors/re/RealtimeSTT

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

林泽炯 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。