- 博客(4)
- 问答 (1)
- 收藏
- 关注
原创 linux深度学习问题汇总
发生的场景较多,推测一般为内存问题,设置内存中栈大小(stack size)上限为无限 ,ulimit -a查看当前上限,-s unlimited设置,该设置为临时设置,只在当前会话生效,会话断开、系统重启等之后应重新设置。使用pytorch库发生死锁,可能与图片的读取(不论是cv2还是PIL读取方式)、内存分配等问题有关,这是深度学习框架的底层工作造成的。另外服务器长时间运行发生死锁的概率要大于刚刚重启时。死锁发生后会向会话不断返回死锁信息,直到彻底死机,ssh断开。尝试使用单线程的指令,避免死锁。
2023-10-14 14:40:17
197
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人