WhisperWriter 使用指南

原创于 2025-04-03 09:24:48 发布

· 480 阅读

版权

WhisperWriter 是一个使用 OpenAI 的 Whisper 语音识别模型开发的简单语音转文字应用。它能够自动将用户的麦克风录音转录为文本，并直接输入到当前活动的窗口中。WhisperWriter 支持多种录音模式，包括连续录音、按需录音等，并且允许用户自定义触发录音的快捷键。

在运行 WhisperWriter 前，确保您的系统中已安装以下软件：

克隆仓库：

git clone https://github.com/savbell/whisper-writer.git
cd whisper-writer

创建并激活虚拟环境：

python -m venv venv
# 对于 Linux 和 macOS:
source venv/bin/activate
# 对于 Windows:
venv\Scripts\activate

首次运行时，会弹出设置窗口。配置完毕并保存后，将打开主窗口。点击“开始”按钮激活键盘监听，然后按下默认的快捷键（Ctrl+Shift+Space）开始录音和转录。

在启动并配置 WhisperWriter 后，您可以按下快捷键开始录音，当您停止说话并有一段足够长的停顿时，程序会自动停止录音并开始转录。转录完成后，文字会自动出现在您当前活动的窗口中。

WhisperWriter 提供了多种录音模式，包括：

您可以在设置中根据需要选择合适的录音模式。

WhisperWriter 可以看作是 OpenAI Whisper 模型应用生态中的一个成员。类似的生态项目可能包括但不限于：

通过这些项目，可以进一步拓展 Whisper 模型在语音识别领域的应用范围。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考