OpenAI开源！！Whisper语音识别实战！！【环境配置+代码实现】

狻猊来当程序媛

已于 2023-08-23 08:56:00 修改

阅读量998

点赞数

文章标签： whisper 语音识别人工智能

于 2023-05-19 16:55:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44274736/article/details/130769685

版权

目录

****** 实现 .mp4转换为 .wav文件，识别后进行关键词匹配并输出关键词出现的次数

****** 完整代码实现请私信

环境配置

安装 ffmpeg

打开网址 https://github.com/BtbN/FFmpeg-Builds/releases
下载如下图所示的文件

下载后解压

我的路径是G:\ffmpeg-master-latest-win64-gpl-shared\bin

找到自己的安装路径，进入到 bin 目录，复制这个路径

在我的电脑中添加环境变量

右击 ---> 属性

高级系统设置

环境变量

找到 path，双击

新建 ---> 把刚刚的路径粘贴进来，确定

在搜索框中输入 cmd ，打开终端，输入 ffmpeg -version，显示如下则表示安装成功

安装 opencc库

pip install opencc -i https://pypi.tuna.tsinghua.edu.cn/simple

安装 torch

pip3 install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple

注：若运行时报关于 numpy 的错误，需要执行下面这个命令，更新 numpy 库

pip install numpy --upgrade

代码实现

只展示核心，完整的请关注并私信

# 利用训练好的模型进行识别
result = whisper_model.transcribe('录音.wav')

狻猊来当程序媛

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
OpenAI开源！！Whisper语音识别实战！！【环境配置+代码实现】

***** 实现 .mp4转换为 .wav文件，识别后进行关键词匹配并输出关键词出现的次数****** 完整代码实现请私信。
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。