问题1:cuda error:device-side assert triggered
标签实际数量与CNN输出的数量不一致,需要改config和对应dataset中的CLASSES
根据config文件中dataset_type修改mmdet\datasets中对应类型的CLASSES,如果是重新写的dataset的py文件,需要将其加入到datasets/init.py中,并重新运行python setup.py develop
进行编译。
并将config文件中的bbox_head和rbbox_head中num_classes设置为:类别数+1
CLASSES和train.json中类别数需保持一致
问题2:关于Redet兼容cuda10.2和torch1.6问题
将mmdet/ops/下面每一个文件夹中/src/.cpp文件中的AT_CHECK改成TORCH_CHECK,如下所示:
#define CHECK_CUDA(x) AT_CHECK(x.type().is_cuda(), #x, " must be a CUDAtensor ")
改成:
define CHECK_CUDA(x) TORCH_CHECK(x.type().is_cuda(), #x, " must be a CUDAtensor ")
每一个文件夹下的.cpp文件都需要改!!!!然后执行install.md中的操作
修改好的redet源代码 可直接编译
问题3:RuntimeError: cuda runtime error (7) : too many resources requested for launch at src/riroi_align_kernel.cu:389"
修改mmdet/ops/riroi_align/src/riroi_align_kernel.cu
将#define THREADS_PER_BLOCK 1024
设置为512或者更小
问题4:python struct.error: ‘i’ format requires -2147483648 <= number <= 2147483647
python3.7/multiprocessing/connection.py报错,多进程时候,进程间数据交换是通过pickling,因为处理的文本都比较大,当数据pickled时候超过了i struct的限制,-2147483648 <= number <= 2147483647,Python3.8中在非windows平台修复了这个问题,利用python3.8/multiprocessing/connection.py直接替换掉原有的python3.7/multiprocessing/connection.py
问题5:Redet编译gcc版本更改问题
ReDet编译gcc版本大于5小于8,建议装7
切换命令:source /opt/rh/devtoolset-7/enable