错误解决集锦
编写程序中遇到的各种问题
坐在云朵上的kiwi
这个作者很懒,什么都没留下…
展开
-
Pytorch使用DataParallel后仍只使用一个GPU
服务器类型:slurm管理下的超算服务器系统:linuxpython版本:3.8虚拟环境:virtualenvpytorch版本:1.10问题描述:在服务器上用上卡跑模型时,使用后,模型和数据仍然只占用第一个gpu,然后内存爆掉。原创 2023-05-14 14:03:12 · 1572 阅读 · 0 评论 -
terminate called after throwing an instance of ‘c10::Error‘ chunk expects at least a 1-d tensor
多卡训练深度学习模型报错 terminate called after throwing an instance of 'c10::Error' what(): chunk expects at least a 1-dimensional tensor原创 2022-12-19 08:46:49 · 2649 阅读 · 0 评论 -
Linux上VSCODE无法打开web视图,“Webview Service Worker Error in registration due to invalid document state”
解决linux中vscode无法打开web视图原创 2022-07-08 02:54:20 · 8247 阅读 · 2 评论 -
virtualenv虚拟环境import torch遇到cannot import name ‘packaging‘ from ‘pkg_resources‘
python 版本:3.8安装pytorch方式:piptorch版本:1.10.0系统:Linux问题描述:$ python>>> import torch错误详细信息Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/project/6019271/siyi/siyi_projects/ENV/lib/python3.8/site-原创 2022-05-25 03:15:18 · 5829 阅读 · 2 评论 -
RuntimeError: stack expects each tensor to be equal size, but got [3, 1053, 1872] at entry 0 and [3,
这个问题出现的原因是因为输入dataloader的图片大小并不一致。注意检查train, test, val数据集是否都进行了图片大小处理。如果没有的话,可以使用test_transform = transforms.Compose([ transforms.Resize((256, 256)), transforms.ToTensor(), transforms.Normalize(mean=[0.485, 0.456, 0.406],std=[0.229, 0.224, 0.2原创 2021-11-16 08:12:13 · 10160 阅读 · 2 评论 -
[Mac OS]git push上传的python文件变成一行,并有很多‘M^’
今天使用’git push’上传代码,发现上传后的github代码格式变得很奇怪不仅变成只有一行,而且换行符变成了‘M^’,重新下载下来后,用mac的文本编辑器和pycharm打开都是正常的,但是用VIM打开还是乱的。查阅资料发现原来是因为github使用的window换行符,与linux和macOS的换行符不同。根据这篇文章,下载软件sublime text,把换行符修改成了window下的,问题成功解决...原创 2021-09-26 14:10:58 · 461 阅读 · 0 评论 -
Mac快速解决zsh: command not found: conda的方法
第一次使用Mac系统,在安装好anaconda后,使用conda --version报错“zsh: command not found: conda”。原因是没有把conda添加进环境路径。解决方法:找到anaconda3/bin的路线,在命令行中打印以下格式“export PATH=~/CS/anacondasiyi/anaconda3/bin:$PATH”其中“~/CS/anacondasiyi/anaconda3/bin”是我电脑中bin的路径。添加好后可以使用conda list但使用c原创 2021-03-04 16:32:39 · 2754 阅读 · 7 评论 -
[Python 环境配置错误] 安装tensorflow的问题 ImportError: DLL load failed: 找不到指定的模块
新开了NLP的学习,莫烦的教程需要原创 2021-01-13 11:40:39 · 434 阅读 · 0 评论 -
[Linux服务器 错误] RunTimeError: Cannot join current thread
关于线程的错误。我的训练指令是nohup python train.py --config-yml configs/lf_disc_faster_rcnn_x101.yml --load-pthpath checkold/checkpoint_31.pth --validate --gpu-id 0 1 --cpu-workers 8 &把cup-worker改成4个就可以了,原因应该是训练和测试同时的时候,都是8个 服务器没那么多...原创 2020-08-08 19:33:42 · 799 阅读 · 1 评论 -
[Linux服务器 错误] 使用xshell connection failed
使用其他的终端平台就可以,唯独xshell不行。不要犹豫,果断放弃,改使用putty,问题解决原创 2020-08-08 16:04:05 · 1660 阅读 · 2 评论 -
[python 环境配置错误] Linux服务器 RunTimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED
在服务器上运行代码时遇到上述错误。首先明确一点,服务器可以安装多种cuda,虚拟环境的cuda可以和服务器的不同,使用cat /usr/local/cuda/version.txt 查看的是服务器的cuda, 并不是虚拟环境的,虚拟环境用conda list直接查看cudatoolkit cudnn的版本。如果遇到上述报错,一定是包不兼容的问题,此时需要认真检查python,tensorflow, pytorch, cuda版本的对应(在网上搜索对应版本)。如果没有问题,那么采用重装一下试试(我就是这样.原创 2020-08-08 15:57:54 · 1446 阅读 · 4 评论 -
[python 环境配置错误] 使用pip安装一个大包报错
报错指令如下pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host=‘files.pythonhosted.org’, port=443): Read timed out.参考博文问题解决使用命令pip --default-timeout=1000 install -U 模块名例如pip --default-timeout=1000 install -U matplotlib来下载matplotlib,原创 2020-06-28 18:09:40 · 304 阅读 · 0 评论 -
[python 环境配置错误] 使用pip时Cache entry deserialization failed, entry ignored 错误解决
使用pip安装包时出现以下错误,然后提示pip的版本太低。于是使用“python -m pip install --upgrade pip”, 还是无法安装。解决方法:使用管理员身份打开命令行工具,再使用上述语句更新pip,成功更新,问题解决!...原创 2020-06-28 17:35:23 · 5022 阅读 · 1 评论