如何本地搭建Whisper语音识别模型

OpenAI开源的Whisper语音转文本模型效果都说还不错,今天就给大家推荐 GitHub 上一个开源项目Whisper Web,允许你可直接在浏览器中运行使用 Whisper。

基于 ML 进行语音识别,并可通过 WebGPU 进行运行加速,无需后端服务器,直接开箱即用。另外,识别到的文本支持导出TXT和JSON两种文件格式。

而结合cpolar内网穿透工具使用,还能轻松实现远程访问本地Windows系统部署的Whisper Web进行语音转文本操作,无需公网IP,也不用设置路由器那么麻烦。

1.本地部署Whisper Web

接下来教大家如何在Windows系统本地安装Whisper Web

项目地址:https://github.com/xenova/whisper-web

1.1 安装git

首先需要从github上克隆Whisper Web(如果没有安装git的话,进入git官网进行下载windows版本 https://git-scm.com/downloads

​编辑​

打开终端,从github下载项目到本地,执行下面的命令:

git clone https://github.com/xenova/whisper-web.git

​编辑​

创建新目录

cd whisper-web

1.2 安装Node.js

然后在项目的根目录下,执行下面的命令:

npm install

如果安装报错,可以检查是否安装Node.js,如未安装可以点击链接下载:

https://nodejs.org/en/download/prebuilt-installer

本例中使用的是下载安装包进行安装,安装后重启终端执行上边npm安装命令即可。

1.3 运行项目

在项目的根目录下,运行Whisper Web,可以看到运行成功,出现http://localhost:5173/

npm run dev

此时,我们在浏览器中输入上边的地址,即可打开Whisper Web页面:

2. Whisper Web使用介绍

在Whisper Web界面,我们可以使用粘贴音频地址,上传音频文件,和使用手机录入语音等方式进行语音转文本的操作。

这里以上传音频文件为例,在上传了一段音频文件后,点击音频进度条下方的设置按钮,进行模型切换和输出为其他语言的选择。

设置完毕后,点击下方的Transcribe Audio
按钮即可自动进行音频转文本:

​​

转换结束后,我们可以将文本导出为TXT或者JSON格式到指定文件夹。

​​

3. 安装Cpolar内网穿透

目前我们在本机部署了Whisper Web,但如果没有公网IP的话,只能在本地局域网环境使用,有一定局限性。如果想在异地通过其他设备使用的话,可以结合Cpolar内网穿透实现远程访问,免去了本地重新部署过程,只需要cpolar生成的公网地址直接就可以链接到Whisper Web中。

下面是安装cpolar步骤:

Cpolar官网地址: https://www.cpolar.com

点击进入cpolar官网,点击免费使用注册一个账号,并下载最新版本的Cpolar

​​

登录成功后,点击下载Cpolar到本地并安装(一路默认安装即可)本教程选择下载Windows版本。

​​

Cpolar安装成功后,在浏览器上访问http://localhost:9200,使用cpolar账号登录,登录后即可看到Cpolar Web配置界面,结下来在web 管理界面配置即可。

​​

4. 配置公网地址

接下来配置一下本地Whisper Web的公网地址,

登录后,点击左侧仪表盘的隧道管理——创建隧道,

创建一个Whisper Web的公网http地址隧道:

  • 隧道名称:可自定义命名,注意不要与已有的隧道名称重复
  • 协议:选择http
  • 本地地址:5173
  • 域名类型:免费选择随机域名
  • 地区:选择China Top

点击创建

​​

隧道创建成功后,点击左侧的状态——在线隧道列表,查看所生成的公网访问地址,有两种访问方式,分别是http和https。

​​

使用任意一个上面Cpolar生成的公网地址,在电脑或任意设备在浏览器进行登录访问,即可成功看到 Whisper Web 界面,这样一个可以远程访问的公网地址就创建好了,使用了Cpolar的公网域名,无需自己购买云服务器,即可在公网访问本地部署的服务了!

5. 公网访问测试

我们用刚才cpolar生成的公网地址,打开一个新的浏览器复制粘贴,可以看到进入到了Whisper Web项目的管理界面。

​​

小结

由于刚才创建的是随机的地址,24小时会发生变化。另外它的网址是由随机字符生成,不容易记忆。如果你有长期远程访问本地部署服务的需求,或者想把域名变成固定,好记的二级子域名,并且不想每次都重新创建隧道来访问你在本地部署的服务,我们可以选择创建一个固定的http地址来解决这个问题。

6. 配置固定公网地址

我们接下来为其配置固定的HTTP端口地址,该地址不会变化,方便分享给别人长期查看你的博客,而无需每天重复修改服务器地址。

配置固定http端口地址需要将cpolar升级到专业版套餐或以上。


登录cpolar官网,点击左侧的预留,选择保留二级子域名,设置一个二级子域名名称,点击保留,保留成功后复制保留的二级子域名名称。

​​

保留成功后复制保留成功的二级子域名的名称:Whisper123(大家可以自定义)

返回登录Cpolar web UI管理界面,点击左侧仪表盘的隧道管理——隧道列表,找到所要配置的隧道 Whisper,点击右侧的编辑:

​​

修改隧道信息,将保留成功的二级子域名配置到隧道中

  • 域名类型:选择二级子域名
  • Sub Domain:填写保留成功的二级子域名

点击更新(注意,点击一次更新即可,不需要重复提交)

​​

更新完成后,打开在线隧道列表,此时可以看到公网地址已经发生变化,地址名称也变成了固定的二级子域名名称的域名:

​​

最后,我们使用固定的公网地址在任何浏览器打开访问,可以看到成功访问 Whisper Web,这样一个固定且永久不变的公网地址就设置好了。

以上就是如何在Windows系统电脑本地部署语音转文本服务Whisper Web,并结合cpolar内网穿透工具实现远程访问使用的全部流程,另外由于该服务无需账号即可在浏览器直接访问,出于安全考虑,建议大家远程访问时不要轻易与他人分享地址,感谢您的观看,有任何问题欢迎留言交流。

### 部署Whisper Web UI的本地指南 为了在本地环境中成功部署Whisper Web UI,需遵循一系列配置指令。虽然提供的参考资料未直接提及Whisper Web UI的具体安装步骤[^1],可以基于常见的Web应用程序部署流程以及社区实践来构建指导。 #### 准备环境 确保计算机上已安装Node.js和npm(Node Package Manager),因为大多数前端项目依赖于这些工具来进行包管理和运行脚本。可以通过命令`node -v` 和 `npm -v` 来验证版本号。 #### 获取源码 前往GitHub或其他托管平台寻找官方或可信第三方维护的Whisper Web UI仓库链接。使用Git克隆该仓库到本地机器: ```bash git clone https://github.com/your-repo-link-here.git whisper-web-ui cd whisper-web-ui ``` #### 安装依赖项 进入项目目录后执行如下命令以下载并安装所有必要的JavaScript库和其他资源文件: ```bash npm install ``` 此过程会读取项目的package.json文件中的dependencies字段,并自动处理所有的外部模块加载工作。 #### 构建应用 对于许多现代单页应用程序(SPA), 可能还需要编译静态资产(如HTML, CSS, JavaScript)以便它们可以在浏览器中正常显示。这通常涉及到调用build脚本来完成这一操作: ```bash npm run build ``` 上述命令将会依据具体的框架(React,Vue等)创建优化后的生产版文件夹dist/,其中包含了可以直接提供给web服务器的内容。 #### 启动开发服务器 如果仅用于测试目的,则可利用内置的轻量级HTTP服务快速启动程序而无需额外设置复杂的反向代理规则: ```bash npm start ``` 此时应该能够在默认端口 (通常是3000 或者8080 ) 上访问正在运行的应用实例 http://localhost:PORT_NUMBER/. #### 生产环境下的部署选项 当准备就绪要将网站公开上线时,考虑采用专业的云服务平台(Nginx,Docker,Kubernetes...)或者无服务器架构(Serverless Functions)作为承载载体;也可以继续沿用简单的Node.js Express中间件方案配合PM2进程守护实现持续在线功能.
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

隔窗听雨眠

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值