cudaMemcpy2D参数中pitch的含义

最新推荐文章于 2024-05-17 20:46:53 发布

ldd530314297

最新推荐文章于 2024-05-17 20:46:53 发布

阅读量2.5k

点赞数 2

文章标签： cuda

本文链接：https://blog.csdn.net/ldd530314297/article/details/42193345

版权

1> pitch的含义
我们知道，对于内存的存取来说，对准偏移量为2的幂（现在一般要求2^4=16）的地址能获取更快的速度，而如果不对齐，可能你需要的数据需要更多的存取次数才能得到。
为了满足这个条件，对于一个二维数组来说（行优先row major），就希望每一行的开头都满足“对齐”，那么如果一行的长度不规整，导致下一行开头不在指定的位置，那就需要在每一行末尾进行填充（padding），从而使得每一行都对齐，这和BMP格式的像素存储是一个道理。

pitch就是指每一行的字节数 + padding的字节数。

2 对于你的问题，对应于CPU端的pitch，就是sizeof(int) * 2,对应于GPU端的pitch，就是d_pitch。

 
        cudaMemcpy2D( d_A,  
        // 目的指针 
       
        d_pitch,  
        // 目的pitch 
       
        bmp1,   
        // 源指针 
       
        sizeof 
        ( 
        int 
        )*2,   
        // 源数据pitch 
       
        sizeof 
        ( 
        int 
        )*2,   
        // 数据拷贝宽度 
       
        2,               
        // 数据拷贝高度 
       
        cudaMemcpyHostToDevice); 
       
        cudaMemcpy2D( bmp2, 
       
        sizeof 
        ( 
        int 
        )*2, 
       
        d_A,  
       
        d_pitch,  
       
        sizeof 
        ( 
        int 
        )*2, 
       
        2, 
       
        cudaMemcpyDeviceToHost);

ldd530314297

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
cudaMemcpy2D参数中pitch的含义

1> pitch的含义我们知道，对于内存的存取来说，对准偏移量为2的幂（现在一般要求2^4=16）的地址能获取更快的速度，而如果不对齐，可能你需要的数据需要更多的存取次数才能得到。为了满足这个条件，对于一个二维数组来说（行优先row major），就希望每一行的开头都满足“对齐”，那么如果一行的长度不规整，导致下一行开头不在指定的位置，那就需要在每一行末尾进行填充（paddin
复制链接

扫一扫