运行Whisper笔记(1)

最近chatGPT很火,就去逛了一下openai的github项目。发现了这个项目。
这个项目可以识别视频中的音频,转换出字幕。
带着一颗好奇的心就尝试自己去部署玩一玩
跟着这篇文章一步步来进行安装,并且跟着这篇文章解决途中遇到的问题。

途中还会遇到几个问题:总结一下:
1、下载cuDNN时会提示叫你登录Navia的账号,我登录的时候发现内地、香港、新加坡的IP登录不了nvdia-develop的官网,换成美国IP则很顺利。这。。。。
2、Ptyhton版本别使用太高的,防止后续pip找不到相关的版本。我原本使用的3.11,后面因为提示找不到相应的版本,换成3.10解决
3、pip运行whisper还会提示缺少一些依赖,直接pip install相关依赖来解决问题

使用效果:
自己的电脑不知道为啥运算很慢,只有百来K每秒,尝试使用CPU或者GPU的参数,速度始终提不上去。CPU以及GPU的利用率也很低很低。我使用的cuda版本为11.8.
识别效果,简单的用了下tiny模式,发现虽然识别有错误,但是的确识别出来了。静等openai更新后续版本再试试效果
![在这里插入图片描述](https://img-blog.csdnimg.cn/0438698ab3c942189a5dad7bf9860f89.png#pic_center
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值