Cudnn占用大量内存问题

13 篇文章 3 订阅
6 篇文章 0 订阅
在部署3D图像识别模型时,发现模型裁剪后内存占用减少不明显,主要由cudnn初始化导致。通过NVIDIA提供的代码测量GPU内存,发现在调用cudnn API后,内存占用增加约550MB。这表明模型进一步优化的空间有限,总计约800MB内存用于模型、封装插件和cudnn。
摘要由CSDN通过智能技术生成

      近来在对一个3D图像识别模型做部署裁剪时发现,做了一些有效的裁剪后,模型启动后占用的内存虽然减少了两三百个M,但是再继续对网络做裁剪缺减少不明显了,包含封装调用这个模型的deepstream插件在内始终占用800多个M,感觉很奇怪,于是花了些时间,捣腾琢磨网络本身的C++实现代码,找出哪些代码执行后占用了可观的内存,最后发现,其他跟训练有关的可减的都减了也没见省多少内存,但是模型启动的过程中,当cudnn的API被第一次调用时,启动有卡顿,同时看着内存一路不停飙升,把相关网络层的代码注释掉试试,结果后面的网络层中调用到cudnn的API时内存又照样飙升,看来cudnn需要占用很多内存。

     为了确认这点,查找了NVIDIA论坛,发现有人也反应过类似问题,NVIDIA也提供了个测试代码用于确认cudnn占用了多少内存,这个代码挺有用的,既可以用于测量你的GPU的内存多大(对于服务器上的NVIDIA GPU,各种型号GPU的内存大小都是已知的,但是对于Jetson各种板子上的GPU,NVIDIA给出各种板子的参数时从来不告诉你上面的GPU的内存是多大,这点很奇怪,似乎怕竞争对手知道?有了下面的代码就可以测量出来了,Nano上的GPU的内存是3.9G多,也就是4G),很显然这个代码可作为个小工具使用,记下来以便以后使用:

#include <stdio.h>
#include "cuda.h"
#include "cudnn.h"
#define ONE_MBYTE (1024*1024)

void printMemInfo()
{
    size_t free_byte ;
    size_t total_byte ;
    cudaError_t cuda_status = cudaMemGetInfo( &free_byte, &total_byte ) ;

    if ( cudaSuccess != cuda_status ){
        printf("Error: cudaMemGetInfo fails, %s\n", cudaGetErrorString(cuda_status));
        exit(1);
    }

    double free_db = (double)free_byte ;
    double total_db = (double)total_byte ;
    double used_db = total_db - free_db ;

    printf(" GPU memory usage: used = %.2f MB, free = %.2f MB, total = %.2f MB\n", used_db/ONE_MBYTE, free_db/ONE_MBYTE, total_db/ONE_MBYTE);
}

int main(){
    printf("Initial memory:");
    printMemInfo();

    cudnnHandle_t handle_;
    cudnnCreate(&handle_);
    printf("After cuDNN create:");
    printMemInfo();

    return 0;
}

   假设文件名叫test_gpu_cudnn_mem.cu,用nvcc编译它,然后执行:

        nvcc test_gpu_cudnn_mem.cu -lcudnn -o test_gpu
       ./test_gpu

可以看到类似下面的结果打印出来:

Initial memory: GPU memory usage: used = 1933.53 MB, free = 2022.68 MB, total = 3956.21 MB
After cuDNN create: GPU memory usage: used = 2484.90 MB, free = 1471.31 MB, total = 3956.21 MB

可以看到总的GPU内存是3.95621G也就是4G吧,cudnn的API被调用后,内存占用一下多了550M左右,运行多次可以看到虽然每次used数值不大一样,但是cudnn起来后,内存占用增加了550M左右。

     通过这个小程序知道,我要裁剪的模型已经没什么好减的了,还有100多M的参数和封装调用这个模型的deepstream插件占用的内存,加上cudnn占用的550M多内存,总共800M左右,也就那样了。  

要配置cuDNN内存不足的问题,可以尝试增加NVIDIA Jetson Nano的内存限制。首先,通过以下步骤连接Jetson Nano并验证cuDNN是否正常安装: 1. 使用MicroUSB线将Nano与主机连接。 2. 在Windows的Powershell中,输入ssh [1,后面是Nano的用户名和IP地址(例如:ssh nano@192.168.55.1)。 3. 进入cuDNN示例目录:cd /usr/src/cudnn_samples_v8/mnistCUDNN。 4. 编译示例程序:sudo make。 5. 为可执行文件添加执行权限:sudo chmod a+x mnistCUDNN。 6. 执行示例程序:./mnistCUDNN。 如果遇到cuDNN内存不足的问题,您可以尝试通过以下步骤增加Jetson Nano的内存限制: 1. 修改Jetson Nano的swap文件大小。打开终端并输入以下命令:sudo nano /etc/dphys-swapfile。 2. 在文件中找到并修改CONF_SWAPSIZE的值,将其增加到较大的值,例如4GB(4096)。 3. 保存文件并退出编辑器。 4. 更新并重启Jetson Nano:sudo /etc/init.d/dphys-swapfile restart,sudo reboot。 这样,Jetson Nano将具有更多的可用内存来处理cuDNN任务,从而解决内存不足的问题。希望这能帮助您解决配置cuDNN内存不足的问题。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [【Jetson Nano 入门】环境配置汇总](https://blog.csdn.net/Huih_cannot_fly/article/details/120907215)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 50%"] - *2* [Jetson Nano配置YOLO v3(CUDA+cudnn+OpenCV+TensorRT)](https://blog.csdn.net/weixin_45319326/article/details/108097387)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Arnold-FY-Chen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值