20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结(whisper)

20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结
2024/1/22 19:52


结论:这个软件如果是习作,可以打101分,功能都实现了。
如果作为商业软件/共享软件,在易用性等方面,可能就只能有70分了。
【百分制】


可选的改进部分:
0、支持INTEL/AMD/ATI的显卡。并且给NVIDIA的显卡自动安装最新的驱动程序和CUDA版本!【对初学者友好!】
1、待转换的音频/视频目录:【中文路径/长目录】对特殊字符的支持
2、(识别)翻译成:语言可以按照拼音顺序排序。当然汉语/简体中文/普通话是可以放到最前面的!
3、计算精度,只列出来所支持的精度,并给出估计的识别时间!
4、打开输出目录。我第一次识别完成在会后就把 识别结果 这个目录剪切走了。
结果下一次识别的时候找不到 识别结果 这个目录,直接退出了!半小时白花了。
如果找到 识别结果 这个目录,可以直接新建的呀!
H:\BaiduNetdiskDownload\音视频转文字字幕小工具\识别结果
5、由于whisper体积庞大,文件众多,导致程序比较凌乱。实际上,根目录下只需要有这两个目录:whisper和 识别结果。

whisper
识别结果


缘起:为了使用openai的whisper识别小语种【非英语】电影的字幕,决定开始折腾CUDA了!
https://github.com/openai/whisper
https://www.bilibili.com/video/BV1d34y1F7qA
https://www.bilibili.com/video/BV1d34y1F7qA/?p=4&vd_source=4a6b675fa22dfa306da59f67b1f22616


1、待转换的音频/视频目录:c:/temp
测试发现只支持英文+数字目录。
【不要使用中文路径/长目录】


2、调用设备:显卡/CPU
你就找一片NVIDIA的CPU吧。
手头紧可以考虑二手:拼多多/淘宝


3、模型:whisper-large-v3就可以了。
不需要特别选择V2版本。


4、计算精度:
float16  不支持x
int8  支持
int8_float16  不支持x
int8_bfloat16  不支持x
bfloat16  不支持x

int8_float32  支持
int16  不支持x
float32  支持

int8_float32  支持【显存占用大概30%?】

float32  支持【显存占用几乎100%,几乎8GB全部占用了!】


5、版权;
由于内核是OpenAI所开源的【whisper】,收费就呵呵了!^_
不过whisper没有UI界面?
有人花时间整理出来,收点小钱¥也不是那么不可以接受的!
有能力的同学可以适当打赏点吧!


参考资料:
https://blog.csdn.net/weixin_42074867/article/details/90046478
win10 GTX1080配置Python CUDA、CUDNN支持

https://developer.nvidia.com/cuda-toolkit-archive
https://developer.nvidia.com/cuda-toolkit-archive
CUDA Toolkit Archive

https://developer.nvidia.com/cuda-12-0-0-download-archive
CUDA Toolkit 12.0.0 (December 2022), Versioned Online Documentation

安装好就可以运行 音|视频转文字|字幕小工具V1.2【openai的whisper】


百度:WIN10 进入安全模式
https://baijiahao.baidu.com/s?id=1773719082166223864&wfr=spider&for=pc
Win10系统电脑进入安全模式的四种方法,让你轻松应对各种问题

方法一:通过强制关机进入自动修复界面
1.当电脑启动时,在Win10启动logo界面按住电源键强制关机,重复此操作三次。


http://www.baike6.com/b385814.html
电脑win10无法正常开机怎么办


https://www.jb51.net/os/win10/811307.html
win10怎么进安全模式 win10系统8种进安全模式方法

https://www.laomaotao.net/more/2023/0728/11528.html
Win10你的电脑未能启动的有效修复方法


https://www.xitongzhijia.net/xtjc/20230221/279941.html
电脑未正确启动怎么办?六种方法解决!(Win10/Win11通用)


https://www.microsoft.com/zh-cn/software-download/windows10
下载 Windows 10

<think>嗯,用户遇到了NVIDIA 5090显卡在Whisper环境中无法使用的问题。首先,我得考虑可能的原因。通常,新显卡刚发布时,驱动和软件支持可能还不完善。Whisper依赖PyTorch或TensorFlow,这些框架需要对应的CUDA版本支持。如果5090是新一代的显卡,可能需要更新的CUDA版本,而用户当前的PyTorch可能还没适配。 接下来,我应该检查用户是否安装了适合的显卡驱动。最新的显卡通常需要最新的驱动版本,比如535以上。然后,CUDA工具包是否兼容5090?如果NVIDIA还没有为5090发布对应的CUDA版本,用户可能需要等待更新。另外,PyTorch或TensorFlow可能尚未添加对该显卡的支持,可能需要从源码编译或者使用nightly版本。 用户的环境配置也需要检查,比如是否正确安装了CUDA和cuDNN,环境变量是否设置正确。虚拟环境有时候会出问题,比如路径错误,导致框架找不到CUDA库。此外,Whisper本身是否有已知的兼容性问题,或者用户是否安装了正确的版本?可能需要升级Whisper到最新版,或者查看GitHub上的issue。 还有,用户是否尝试过强制使用CUDA?比如在代码中指定device为cuda:0。有时候框架可能默认使用CPU,需要显式启用GPU。另外,运行一个简单的PyTorch测试脚本,比如创建张量并移到GPU,可以确认是否是框架层面的问题。 最后,如果以上步骤都无效,可能需要联系NVIDIA支持,或者等待框架和驱动更新。同时,用户也可以尝试使用Docker镜像,有些预配置的环境可能已经包含必要的依赖。</think>### 解决方案:NVIDIA 5090显卡在Whisper环境下无法使用的问题 #### 1. 确认显卡驱动兼容性 - **步骤**:检查NVIDIA驱动版本是否支持RTX 5090(建议535.xx或更高版本) - **代码验证**: ```bash nvidia-smi # 输出右上角显示Driver Version ``` - **说明**:若驱动版本过旧,需从[NVIDIA官网](https://www.nvidia.com/Download/index.aspx)下载最新驱动[^1] #### 2. 验证CUDA工具链兼容性 - **步骤**:确认CUDA版本与RTX 5090的架构匹配 - **关键命令**: ```bash nvcc --version # 查看CUDA编译器版本 cat /usr/local/cuda/version.txt ``` - **注意**:若使用conda虚拟环境,需检查环境内CUDA版本与系统级CUDA的兼容性[^2] #### 3. PyTorch/TensorFlow适配性处理 - **推荐方案**: ```bash # 安装PyTorch nightly版本(含新架构支持) pip install --pre torch torchaudio -f https://download.pytorch.org/whl/nightly/cu121/torch_nightly.html ``` - **验证代码**: ```python import torch print(torch.cuda.is_available()) # 应输出True print(torch.cuda.get_device_name(0)) # 应显示RTX 5090 ``` #### 4. Whisper版本强制配置 - **环境变量设置**: ```bash export WHISPER_CUDA_FORCE=1 # 强制启用CUDA加速 export PATH=/usr/local/cuda-12.1/bin:$PATH # 显式指定CUDA路径 ``` - **版本升级建议**: ```bash pip install git+https://github.com/openai/whisper.git # 安装最新开发版 ``` #### 5. Docker容器化方案 - **推荐镜像**: ```dockerfile FROM nvcr.io/nvidia/pytorch:23.09-py3 RUN pip install git+https://github.com/openai/whisper.git ``` - **启动命令**: ```bash docker run --gpus all -it --rm whisper-container ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值