PyTorch socket.error [Errno 111] Connection refused

最新推荐文章于 2024-03-09 21:04:19 发布

SnailTyan

最新推荐文章于 2024-03-09 21:04:19 发布

阅读量6.8k

点赞数

分类专栏：深度学习文章标签： PyTorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/quincuntial/article/details/79067567

版权

深度学习专栏收录该内容

84 篇文章 14 订阅

订阅专栏

文章作者：Tyan
博客：noahsnail.com | CSDN | 简书

1. 问题描述

在nvidia-docker中使用PyTorch训练深度模型时，会碰到程序突然挂掉的情况，主要现象是产生core文件，有时输出错误信息，有时没有错误信息，进程会挂在哪里，错误信息类似于：

socket.error: [Errno 111] Connection refused

通常问题会定位在/usr/local/lib/python2.7/dist-packages/torch/utils/data/dataloader.py。

2. 问题原因

Please note that PyTorch uses shared memory to share data between processes, so if torch multiprocessing is used (e.g. for multithreaded data loaders) the default shared memory segment size that container runs with is not enough, and you should increase shared memory size either with --ipc=host or --shm-size command line options to nvidia-docker run.

主要原因在于PyTorch的数据加载是多线程的，它们使用的是共享内存来共享数据，默认的共享内存是不够的，因此需要增加共享内存。

3. 解决方案

主要是在启动docker时加上--ipc=host参数。

nvidia-docker run --ipc=host -ti -v $(pwd):/workspace docker-image

参考资料

https://github.com/pytorch/pytorch

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
PyTorch socket.error [Errno 111] Connection refused

文章作者：Tyan 博客：noahsnail.com | CSDN | 简书1. 问题描述在nvidia-docker中使用PyTorch训练深度模型时，会碰到程序突然挂掉的情况，主要现象是产生core文件，有时输出错误信息，有时没有错误信息，进程会挂在哪里，错误信息类似于：socket.error: [Errno 111] Connection refused通
复制链接

扫一扫

专栏目录

SnailTyan

CSDN认证博客专家 CSDN认证企业博客

码龄9年

812: 原创

1万+: 周排名

200万+: 总排名

264万+: 访问

: 等级

2万+: 积分

1863: 粉丝

893: 获赞

344: 评论

2872: 收藏

私信

关注

热门文章

分类专栏

最新评论

LBP特征原理及代码实现
元气少女缘结神: https://blog.csdn.net/wd1603926823/article/details/127517925
LBP特征原理及代码实现
CuteDuan_: 你好，请问skimage.feature.local_binary_pattern中哪个模式取值范围是9种的
LBP特征原理及代码实现
元气少女缘结神: 作者这句应该加上等价二字，就没问题了，像p=8时，虽然跳变4次的有140种，但4次属于混合模式不纳入计算。我们只看<3次的跳变即等价模式，p=8时跳变0次的有2种，跳变1次的有0种，跳变2次的有56种。所以对于等价模式，基本都是跳变2次。这么看的话他说的没错。
LBP特征原理及代码实现
元气少女缘结神: 可能作者那句只是说的p比较小的情况，比如p=3时，等价模式有8种，其中跳变2次的就占了6种。比如p=4时，等价模式有14种，跳变2次的情况就占了12种。
LBP特征原理及代码实现
元气少女缘结神: 他这个函数是从(radius,radius)坐标点开始计算的，计算完毕后得到临时的结果图dst，然后再对dst每个像素值（这里才是从0,0开始计算）循环处理得到最终的dst。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。