参考文档1: 2024 最新PyTorch源码编译流程和踩坑记录,PyTorch build from source_编译pytorch-CSDN博客
踩坑系列:
1. 源码安装成功pytorch后torchvision两者版本不对应导致运行失败,torchvision::nms, 然后重新切换到pytorch.release2.2再源码安装,解决问题
2.运行release2.2安装结果报错,现有的解决办法都不行,计划重新源码安装pytorch main分支
torch.distributed.DistBackendError: NCCL error in: XXXXdistributed/c10d/ProcessGroupNCCL.cpp:1691, unhandled cuda error (run with NCCL_DEBUG=INFO for details), NCCL version 2.19.3
3. 依旧报错:RuntimeError: operator torchvision::nms does not exist
解决方案: 在pytorch文件夹外面: import torchvision !!!!