- 运行train的过程中遇到的crash问题:原因是在docker中运行,shm 设置太小导致share memory 不够。
解决方案:https://github.com/pytorch/pytorch#docker-image
启动docker 的时候加上--ipc=host or --shm-size 参数
pytorch bus error (core dumped)
解决方案:https://github.com/pytorch/pytorch#docker-image
启动docker 的时候加上--ipc=host or --shm-size 参数
pytorch bus error (core dumped)