win10系统配置faster rcnn（cuda10.1+pytorch1.4或cuda11.7+pytorch1.12）

什么都码

已于 2023-07-03 19:17:52 修改

阅读量2k

点赞数 2

分类专栏：深度学习文章标签： python 深度学习 pytorch

于 2021-04-08 14:54:49 首次发布

本文链接：https://blog.csdn.net/Memphis147/article/details/115519873

版权

深度学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

win10安装faster rcnn pytorch版本，折腾了挺长时间，做下记录，主要参考了win10和win7系统配置faster rcnn（pytorch），本人python3.6，torch1.4，vs2019，cuda10.1 win10，2080ti实测成功。

记录一下期间遇到的问题：

（1）cl.exe找不到或者cl相关的报错：
把cl.exe添加到环境变量：

C:\Program Files (x86)\Microsoft Visual Studio\2019\Community\VC\Tools\MSVC\14.27.29110\bin\Hostx64\x64

添加后，cmd输入cl可显示：
在这里插入图片描述
（2）若电脑有多个vs，需设置vs2019：

SET MSSdk=1
SET DISTUTILS_USE_SDK=1
call “C:\Program Files (x86)\Microsoft Visual Studio\2019\Community\VC\Auxiliary\Build\vcvarsall.bat” amd64 -vcvars_ver=14.28

成功会显示：
在这里插入图片描述

（3）出现ROIAlign_cuda.cu(100): error: calling a host function(“__ceilf”) from a global function("RoIAlignForward ") is not allowed的错误：
把出错地方改为：ceilf

(4) 出现：nvcc fatal错误：
将操作(1)(2)可解决，或者添加cuda lib\x64文件夹到环境变量（以下是我的路径，取决于你安装的路径）

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\toolkit\lib\x64

--------------------------------------------------------------------------------分割线------------------------------------------------------------------------------------
--------------------------------------------------------------------torch1.12配置faster rcnn------------------------------------------------------------------------

时隔两年，因项目需求，本人又在RTX A6000上配置了一遍faster rcnn的环境，环境为cuda11.7，python3.8，torch1.12，vs2022。因torch版本升级到1.12，THC相关包被弃用，导致编译过程中出现了各种问题，主要参考了升级到pytorch1.11要改的内容，在torch1.4的配置方案的基础上，根据编译过程中的报错内容，找到csrc/cuda文件夹中的nms.cu，ROIAlign_cuda.cu和ROIPool_cuda.cu三个文件，将文件中以下内容更改：

将#include <THC/THC.h>注释掉；
THCudaCheck换成AT_CUDA_CHECK；
#include <THC/THCDeviceUtils.cuh>替换为#include “ATen/cuda/DeviceUtils.cuh”；
添加 #include <ATen/ceil_div.h>，THCCeilDiv 替换为at::ceil_div或者直接将THCCeilDiv(a,b)改成(a+b-1)/b；
注释掉THCState，及其state 相关内容，例如：// THCState *state = at::globalContext().lazyInitCUDA()；
添加头文件#include “ATen/cuda/ThrustAllocator.h”，替换THCudaMalloc为c10::cuda::CUDACachingAllocator::raw_alloc，例如：

	// mask_dev = (unsigned long long*) THCudaMalloc(state, boxes_num * col_blocks * sizeof(unsigned long long));
	mask_dev = (unsigned long long*) c10::cuda::CUDACachingAllocator::raw_alloc(boxes_num * col_blocks * sizeof(unsigned long long));

最后编译：

cd lib
python setup.py build develop

运行程序，缺什么包就使用pip命令装什么包，为方便大家编译成功，现将更改后的nms.cu，ROIAlign_cuda.cu和ROIPool_cuda.cu三个文件代码上传，如有需要请自行下载（注本项目采用的jwyang的代码）。

什么都码

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
3
评论
win10系统配置faster rcnn（cuda10.1+pytorch1.4或cuda11.7+pytorch1.12）

win10安装faster rcnn pytorch版本，做下记录，本人在python3.6，torch1.4，vs2019，cuda10.1 win10，2080ti平台和python3.8，torch1.12，vs2022，cuda11.7 win10，RTX A6000均实测成功。
复制链接

扫一扫

专栏目录