- 运行环境:远程linux服务器,Pytorch环境
- 问题描述:
-
ERROR: Unexpected bus error encountered in worker. This might be caused by insufficient shared memory (shm). # 错误:工作线程中遇到意外的总线错误。这可能是由共享内存 (shm) 不足引起的。
- 如图:
- 原因分析:问题定位到是和dataloader的numworker设置有关,可能是由于numworker设置的过大引起的。
- 解决:将numworker设置为小于原来的设置数量,如设置为原来的一半。
- 参考:如何设置numworker,及numworker的工作的原理参考:
Pytorch DataLoader中的num_workers (选择最合适的num_workers值)_numworkers设置多少_堇禤的博客-CSDN博客