![](https://img-blog.csdnimg.cn/e3319f9fac7b4129bd3cda6f72cbc2a6.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
Python模块有关问题
文章平均质量分 81
包括Pytorch、TensorFlow等模块有关问题
yyywxk
VX:931744281
展开
-
Windows 下 VMamba 安装教程(无需更改base环境中的cuda版本且可加速)
时,按照官方的安装命令会遇到各种各样的错误,Linux 版本的问题可参考本人之前的博客——,本篇主要聚焦于 Windows 下 Vmamba 环境的安装,主要参考。最近有不少小伙伴在 Linux 上安装 Vmamba (因此,只需在四个文件下加入以下代码即可。出现这种情况的原因,可参考。具体文件和步骤参看前一节。具体步骤参看前一节。原创 2024-07-14 21:05:04 · 731 阅读 · 0 评论 -
Window 下Mamba 环境安装踩坑问题汇总及解决方法 (无需绕过selective_scan_cuda)
将 anaconda环境下的 lib/python3.6/site-packages/torch/utils/cpp_extension.py文件里的[‘ninja’,‘-v’]改成[‘ninja’,‘–v’] 或者[‘ninja’,‘–version’] 是错误的做法,治标不治本。这是最基本的报错信息,只要编译出错就会输出这些,如果在其上面没有看到具体报错,可在。,禁用掉可以看到具体的报错,但是编译速度实测会变慢,所以解决bug后可以改回来。pytorch默认使用ninjia作为backend。原创 2024-07-14 20:43:48 · 893 阅读 · 1 评论 -
VMamba 安装教程(无需更改base环境中的cuda版本)
下面分别是 CUDA 12.1 和 CUDA 11.8 两种环境的安装,由于此时 CUDA 的内核以及相关文件均安装在虚拟环境中,可以不考虑base环境里 CUDA 的版本。),但是有些问题无法解决,特此汇总。注意,即使base环境中安装的 CUDA 版本过低,也不影响 Mamba,Vim 以及 VMamba 环境的正常安装。因此,本段输出开头和结尾的报错信息毫无用处,需要重点查看中间部分的报错输出。,原因同报错3,但此时 nvidia 下已经找不到对应的包了,出现报错的位置变成了 Python。原创 2024-07-14 17:05:09 · 1204 阅读 · 0 评论 -
Stable Diffusion / huggingface 相关配置问题汇总
OSError: Can't load tokenizer for 'openai/clip-vit-large-patch14'原创 2024-07-10 15:11:45 · 1084 阅读 · 1 评论 -
conda 重命名虚拟环境
先使用–clone命令复制一份老环境,然后改名并删除老环境。但是,如果原始环境比较大,clone的时间会比较长。原创 2024-07-07 19:35:19 · 385 阅读 · 0 评论 -
Pytorch PyTorch模型训练:运行时错误:cuDNN错误:CUDNN_STATUS_INTERNAL_ERROR
cuDNN(CUDA Deep Neural Network)是一个加速深度神经网络训练和推断的GPU加速库。它提供了高性能的核心例程和深度神经网络的加速算法,用于解决卷积神经网络(CNN)的计算密集型任务。cuDNN通过利用GPU的强大计算能力,加速了神经网络的训练和推断过程。首先,我们应该检查GPU显存是否足够。如果显存不足,我们可以尝试减小批量大小、优化模型结构以减少参数数量,或者使用多个GPU进行模型训练。其次,我们需要确保使用的PyTorch版本与cuDNN库版本兼容。转载 2024-06-29 20:11:08 · 80 阅读 · 0 评论 -
ImportError: libstdc++.so.6: version `GLIBCXX_3.4.29‘ not found
某些网友出现了“gcc 版本中的so文件与anaconda 中scipy冲突”、 pandas 冲突等。,但是并没有真正的解决问题,也没有必要。需要根据报错提示中涉及到的包具体问题具体分析。提示错误gcc 版本中的so文件与anaconda 中的包冲突。,一些依赖包的版本可能出了问题,导致不匹配。譬如在笔者遇到的问题中,涉及到的包是。,也均是通过重新安装相应的包解决问题。成功结果问题,不再报错。很多网上的方法都是手动配置链接。可能会卸载更多的相关包)原创 2024-05-02 19:16:01 · 384 阅读 · 0 评论 -
Mamba 环境安装踩坑问题汇总及解决方法(Windows已解决)
最近Mamba有关的论文引起了众多人的关注,虽然Mamba论文自身被ICLR 2024拒稿,但是其衍生的模型层出不穷,诸如和等。;)时,发现按照他们给的安装方法安装时会遇到非常多的bug,主要集中在和mamba-ssm上,原因都是问题,特此记录。原创 2024-02-07 17:35:13 · 31039 阅读 · 219 评论 -
ValueError: high is out of bounds for int32 报错
笔者在平台跑一个在Ubuntu上运行正常的程序时,出现了以下报错:。原创 2023-10-08 10:03:17 · 1740 阅读 · 0 评论 -
RuntimeError: CUDA error: an illegal memory access was encountered 解决思路
RuntimeError: CUDA error: an illegal memory access was encounteredGPU负载原创 2023-09-09 10:11:18 · 8181 阅读 · 0 评论 -
os.environ[CUDA_VISIBLE_DEVICES] 失效无法指定 GPU
为了避免不必要的麻烦,有些博客说的方法是对的,即在import之前配置好GPU。(注意,它们所说的需要在之前设置其实实测不影响。)在命令行或者.sh文件里,在运行.py文件前直接指定GPU,其他方法可参考Pytorch 指定GPU。原创 2022-10-20 20:59:02 · 6693 阅读 · 1 评论 -
RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED 问题解决记录
问题描述:在运行 PyTorch 代码时遇到以下 Bug:/opt/conda/conda-bld/pytorch_1634272128894/work/aten/src/ATen/native/cuda/NLLLoss2d.cu:95: nll_loss2d_forward_kernel: block: [0,0,0], thread: [225,0,0] Assertion `t >= 0 && t < n_classes` failed...loss.backwa原创 2021-12-07 16:08:38 · 23244 阅读 · 7 评论 -
不同PyTorch版本训练同一个代码结果差异巨大
问题描述:笔者在训练一个深度学习网络时,发现使用不同的PyTorch版本运行同一个训练代码,训练出来的网络结果差异巨大。具体来说,笔者训练得到的结果如下所示:PyTorch版本Torchvision版本测试结果1.20.4.082.580171.50.6.083.118471.60.7.074.977951.100.11.168.33818网络的参数以及训练的设置完全相同,但是却得到了差异巨大的结果。原因分析:发现在 Torchvisi原创 2021-11-29 12:23:16 · 15344 阅读 · 4 评论 -
No module named ‘torchvision.models.utils‘
目录- 问题描述- 原因探寻- 解决方法- 方法一:- 方法二:- 方法三- 问题描述笔者在使用 pytorch=1.10.0, torchvision=0.11.1 的环境运行代码时,运行到语句 from torchvision.models.utils import load_state_dict_from_url 时会出现以下报错:>>> from torchvision.models.utils import load_state_dict_from_urlTraceba原创 2021-11-23 12:00:32 · 28272 阅读 · 14 评论 -
opencv-python 使用中遇到的问题
目录前言1. opencv-python 与 opencv-contrib-python 的关系- 问题描述- 原因分析- 解决方法2. 人脸检测函数 detectMultiScale 调用后卡住,程序无法停止- 问题描述- 原因分析- 解决方法3. cv2.waitKey(0) 关闭窗口后程序不自动停止- 问题描述- 原因分析- 解决方法前言笔者在进行人脸识别实验时,调用了 cv2 模块的相关函数,但是在使用时遇到了一些问题,现记录如下。1. opencv-python 与 opencv-contr原创 2021-06-15 17:09:59 · 5207 阅读 · 11 评论 -
Pytorch 预训练模型下载和加载
PyTorch 加载和下载预训练模型可参考:pytorch预训练模型的下载地址以及解决下载速度慢的方法- 下载地址常用预训练模型在这里面:https://github.com/pytorch/vision/tree/master/torchvision/models但是上述网址只有常见的 backbone (vgg, resnet, densenet, alexnet),在 GitHub 上,还找到了一个项目,提供 NASNet, ResNeXt, ResNet, InceptionV4, Incep原创 2020-08-27 09:55:07 · 2829 阅读 · 2 评论 -
NumPy 布尔索引
NumPy 布尔索引布尔索引实现的是通过列向量中的每个元素的布尔型数值对一个与列向量有着同样行数的矩阵进行符合匹配。这种作用,其实是把列向量中布尔值为True的相应行向量给抽取了出来。...原创 2019-04-01 20:56:54 · 6389 阅读 · 0 评论 -
PyTorch 训练时中遇到的卡住停住等问题
- 问题描述使用 PyTorch 框架训练模型,训练第一个 epoch 时,在最后一个 batch 处卡死,卡了一天都没有动弹,而 CPU 和 GPU 都处于正常运行的状态,程序也没有报错,并且之前训练一直都是正常的。最终,只能通过 Ctrl+C 强制性暂停。如下图所示。- 可能的原因搜索文章发现,有人出现这种问题是和 cv2.imread 有关,用 OpenCV 的接口进行数据读取,而没有用 PIL,导致出现 OpenCV与Pytorch互锁的问题,关闭OpenCV的多线程即可解决问题1 2。但原创 2020-05-24 23:17:28 · 63312 阅读 · 29 评论 -
labelme 中遇到的问题
在批量转换 json 文件时,出现以下报错:AttributeError: module ‘labelme.utils’ has no attribute ‘draw’类似的还可能出现:AttributeError: module ‘labelme.utils’ has no attribute 'draw_label’等错误。这是由于 labelme 版本的问题。高版本在 labelme 的utils文件夹里缺少 draw.py 文件。有如下解决方案:降低 labelme 的版本,可参原创 2020-05-19 16:54:22 · 3818 阅读 · 2 评论 -
PyTorch中使用TensorboardX
TensorboardX是在tensorboard的基础上做出来。因此很多文章[1][2]认为,它需要tensorflow支持,使用时应当安装TensorFlow。根据其github的介绍,也是需要安装TensorFlow。不过,我们不一定要在pytorch环境中安装TensorFlow,这样会显得很混乱。不安装TensorFlow时,执行:tensorboard --logdir=路径名...原创 2020-04-07 13:04:40 · 1000 阅读 · 2 评论