语音转文字，功能更强大的工具

stereohomology

已于 2023-11-14 17:42:25 修改

阅读量1k

点赞数

分类专栏：学习学习文章标签：自然语言处理语音识别笔记人工智能

于 2023-10-09 17:33:24 首次发布

本文链接：https://blog.csdn.net/stereohomology/article/details/133709880

版权

学习学习专栏收录该内容

670 篇文章

订阅专栏

这次是从一个微信公众号发现的，尝试了一下其中的方法1，果然强大好用。

方法1

使用 OpenAI 开源的语音转文字模型 Whisper，通过这个模型可以实现语音转文字，即使是离线也能使用。

因为开源的 Whisper 需要通过 python 和命令行来执行，所以我们找到了已经封装好的软件，可以直接使用。

打开软件下载：https://github.com/Const-me/Whisper/releases/

下载 WhisperDesktop.zip 文件，解压出来即可。

下面则是用到的离线库的下载地址：

https://huggingface.co/ggerganov/whisper.cpp/tree/main

我挑了最大个儿的多语言库，尝试11分钟的语音文件，电脑显卡是集成的，速度很慢，但转换出来的效果非常好，而且可以导出为特定格式的文本形式：
在这里插入图片描述