文章目录
前言
OpenAI开源的 Whisper 语音转文本模型效果都说还不错,今天就给大家推荐 GitHub 上一个开源项目 Whisper Web,允许你可直接在浏览器中运行使用 Whisper。
基于 ML 进行语音识别,并可通过 WebGPU 进行运行加速,无需后端服务器,直接开箱即用。另外,识别到的文本支持导出 TXT 和 JSON 两种文件格式。
而结合cpolar内网穿透工具使用,还能轻松实现远程访问本地Windows系统部署的Whisper Web进行语音转文本操作,无需公网IP,也不用设置路由器那么麻烦。
1.本地部署Whisper Web
接下来教大家如何在Windows系统本地安装Whisper Web
项目地址:https://github.com/xenova/whisper-web
1.1 安装git
首先需要从github上克隆Whisper Web(如果没有安装git的话,进入git官网进行下载windows版本 https://git-scm.com/downloads)
打开终端,从github下载项目到本地,执行下面的命令:
git clone https://github.com/xenova/whisper-web.git
创建新目录
cd whisper-web
1.2 安装Node.js
然后在项目的根目录下,执行下面的命令:
npm install
如果安装报错,可以检查是否安装Node.js,如未安装可以点击链接下载:
https://nodejs.org/en/download/prebuilt-installer