CUDA锁页内存

最新推荐文章于 2024-08-15 19:38:16 发布

skelking

最新推荐文章于 2024-08-15 19:38:16 发布

阅读量4.9k

点赞数 6

分类专栏： CUDA 文章标签：锁页内存

CUDA 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

一下内容是大部分来自http://www.findspace.name/easycoding/1349，还有小部分来自《CUDA专家手册》，整理记录下来作为学习过程中的笔记

主机处理器（CPU）支持虚拟内存系统，允许程序员使用比实际空间更大的内存空间，可以认为虚拟内存是内存容量受限留下的后遗症。

大多数系统中虚拟内存空间被划分成许多页，它们是寻址的单元，页的大小至少4096个字节。虚拟寻址能使一个连续的虚拟地址空间映射到物理内存并不连续的一些页。

锁页内存允许GPU上的DMA控制器请求主机传输，而不需要CPU主机处理器的参与。

锁页是操作系统常用的操作，可以使硬件外设直接访问CPU内存，从而避免过多的复制操作。被锁定的页面已被操作系统标记为不可被操作系统换出的，所以设备驱动程序给这些外设编程时，可以使用页面的物理地址直接访问内存，而CPU仍然可以访问上述锁页内存，但是此内存是不能移动或换页到磁盘上的。

在GPU上分配的内存默认都是锁页内存，这只是因为GPU不支持将内存交换到磁盘上。

在主机上分配锁页内存，使用特殊的cudaHostAlloc函数，或者使用常规的malloc函数，然后再将其注册(cudaHostRegister)为锁页内存。注册为锁页内存只是设置一些内部标志以确保内存不被换出，并告诉CUDA驱动程序，该内存为锁页内存，可以直接使用它而不需要使用临时缓冲区。

如果使用cudaHostAlloc，则需要使用cudaFreeHost函数释放这一块内存，不能调用常规的C语言函数释放，不然会崩溃或者出现一些不常见的错误。

cudaHostAlloc函数的原型是：

cudaError_t cudaHostAlloc( void ** host_pointer, size_t size, unsignedint flags )

然而分页锁定主机存储器是稀缺资源，所以分配太多的分页锁定内存的话，分配会失败，另外由于减少了系统可分页的物理存储器数量，分配太多的分页锁定内存会降低系统的整体性能。

使用分页锁定内存，分页锁定内存和显存之间的的拷贝速度大约是6G/s，普通的分页内存和显存之前的拷贝速度是3G/s（GPU显存之间的拷贝速度是30G/s，CPU内存之间的拷贝速度是10G/s），但是这种方式会带来额外的CPU内存间拷贝时间开销，CPU需要先把数据从可分页内存拷贝到分页锁定内存。

采用注册为锁页内存（cudaHostRegister）把普通内存改为分页锁定内存，则不会带来额外的CPU内存拷贝时间开销。

关注

6
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

skelking CSDN认证博客专家 CSDN认证企业博客

码龄13年

8: 原创

41万+: 周排名

80万+: 总排名

6万+: 访问

: 等级

773: 积分

16: 粉丝

21: 获赞

6: 评论

43: 收藏

私信

关注

热门文章

分类专栏

图像处理 13篇
C++ 7篇
综合 1篇
模式识别 1篇
opencv 1篇
CUDA 3篇

最新评论

kuwahara filter 实现
taiquandao49: ii(x,y)=ii(x,y-1)+ii(x-1,y)-ii(x-1,y-1)+i(x-1,y-1)最后应该是i(x,y)
Qt5.4（MSVC2013 64位）+OpenCV2.4.10配置
a2583211 回复今天的我又写出来什么BUG: “每次编辑.pro文件都记得要qmake一次”，因为Qt,msvc版本的，你构建的时候，如果makefile文件存在，它是不会更新的，也就是你还会报上次的错误。你qmake一次，也就重新生成makefile文件
Qt5.4（MSVC2013 64位）+OpenCV2.4.10配置
a2583211 回复熊叫大雄: openc也有分debug跟release版本，两个不能混用。你仔细看看，会发现你包含的lib文件多了一个d字母，这是debug版本的
CUDA锁页内存
TriLoo: 一直有疑问就是，为了使用异步传输数据，在主机端必须使用锁页内存，也就需要把主机端数据先从非锁页内存拷贝到锁页内存中才能cudaMemcpy2DAsync进行异步传输，直到现在看到cudaHostRegister这个函数。。。感觉自己好菜，楼主是怎么学习CUDA的？谢谢~
Qt5.4（MSVC2013 64位）+OpenCV2.4.10配置
今天的我又写出来什么BUG: 什么叫 “每次编辑.pro文件都记得要qmake一次”啊，还有博主，我的会报错Error: undefined reference to `cv::imread(std::string const&, int)'

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。