音频转文字-在线工具包及使用记录

资料来源:https://zhuanlan.zhihu.com/p/269603431(多种方案)
视频教程:https://www.youtube.com/watch?v=L1H5ov4WTBg

https://github.com/openai/whisper

// 创建虚拟环境
python -m venv myvnev

// 激活虚拟环境
source myvnev/bin/activate

pip install --upgrade pip
升级pip,在虚拟环境安装package的工具

安装openai-whisper
pip install -U  openai-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple

// 安装brew
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

// 安装ffmpeg
brew install ffmpeg
// 安装setuptools-rust
pip install setuptools-rust
pip show setuptools-rust 检测

// 编译 替换xx-filePath
whisper xx-filePath --language Chinese --model base --device mps --output_format srt --output_dir ~/Desktop

// --device mps 去掉去执行CPU
whisper xx-filePath --language Chinese --model base --output_format srt --output_dir ~/Desktop

https://github.com/ggml-org/whisper.cpp
这个只支持wav格式,可能更快吧

sh ./models/download-ggml-model.sh large-v3-turbo

// 模型下载地址:
https://huggingface.co/ggerganov/whisper.cpp/tree/main

// 验证执行命令(只能识别wav文件,需要ffmpeg提前转译):
./build/bin/whisper-cli -m models/ggml-large-v3.bin -f samples/jfk.wav  -osrt ~/Desktop/large-v3.srt

// ffmpeg转wav
ffmpeg -i input.mp3 -ar 16000 -ac 1 -c:a pcm_s16le output.wav
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值