- 博客(2)
- 收藏
- 关注
原创 DistributedDataParallel多显卡训练模板
整理一个通用模板,省的每次需要的时候再找,代码应该是可以直接运行的,就是损失老大了。
2024-03-19 22:27:55 142
原创 RuntimeError: CUDA error: device-side assert triggered
# 记一次device-side assert triggered,报错如下 /pytorch/aten/src/ATen/native/cuda/Loss.cu:115: operator(): block: [0,0,0], thread: [0,0,0] Assertion `input_val >= zero && input_val <= one` failed. /pytorch/aten/src/ATen/native/cuda/Loss.cu:115: ope
2024-03-19 21:01:59 207
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人