项目实训:python whisper安装运行 实现语音识别技术

1.最好用python3.9以上的版本

2.安装whisper库

pip install -U openai-whisper

输入whisper查看是否安装成功

3.下载ffmpeg并添加环境变量 

Releases · BtbN/FFmpeg-Builds (github.com)

下载成功后,配置环境变量,右键我的电脑->属性->高级系统设置->环境变量->系统变量->Path

将bin目录的地址添加进来

然后检查是否成功 win+R cmd,输入ffmpeg,显示如下,则安装成功

3.Whisper主要是基于Pytorch实现,所以需要在安装有pytorch的环境中使用。

安装pytorch

pip3 install torch torchvision torchaudio

4.安装zhconv,将繁体字转换为简体字

pip install zhconv

5.测试

写一段代码

import whisper
import zhconv

model = whisper.load_model("base", "cpu")
mps_path = r"1.mp3"
result = model.transcribe(mps_path, fp16=False, language='Chinese')
s = result["text"]
s1 = zhconv.convert(s, 'zh-cn')
print(s1)
运行,报错,错误信息:
FileNotFoundError: [WinError 2] 系统找不到指定的文件。

参考https://blog.csdn.net/zdm_0301/article/details/133854913?spm=1001.2014.3001.5506

感谢这位博主,成功解决这个给问题,把参数改为true后,重启电脑,运行成功

没有做分词操作,后续继续处理,总体识别还是不错的。

  • 7
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
Whisper是一款可以实现语音识别转文字的应用软件。它可以通过下载安装在手机或电脑上,实现将语音转化为文字的功能。 使用Whisper进行语音识别转文字非常简便。首先,用户需要下载并安装Whisper应用,可以在各大应用商店或官方网站上获取。安装完成后,用户可以打开应用,并按照界面上的提示进行设置和授权。接下来,用户可以开始使用Whisper进行语音转文字的操作。 在使用Whisper进行语音识别转文字时,用户可以选择两种方式。一种是通过录制语音进行识别,用户只需按下录制按钮,开始说话,Whisper会自动将语音转化为文字。另一种方式是通过实时语音输入进行识别,用户可以直接讲话到麦克风,Whisper会实时将语音转为文字显示在屏幕上。 Whisper语音识别转文字功能非常准确和快速。它采用了先进的语音识别技术,能够准确地识别各种语音,并将其转化为文字。同时,Whisper还支持多国语言的识别,可以满足不同用户的需求。 通过Whisper进行语音识别转文字,用户可以享受到很多便利。无论是需要记录会议内容、学习笔记,还是进行语音交流的转化,Whisper都能够帮助用户快速准确地将语音转化为文字,并保存在手机或电脑上。这样,用户可以方便地进行查看、编辑和分享。 总之,Whisper是一个功能强大、操作简便的语音识别转文字应用软件,通过下载安装,用户可以随时随地将语音转化为文字,提高工作和学习的效率。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值