![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
GPU体系结构
grasshoper97
这个作者很懒,什么都没留下…
展开
-
conflict miss 和 capacity miss
在Hennessy和Patterson的经典教材《软硬件接口》《量化研究方法》中,介绍了3C模型。但对冲突缺失的定义,却含混不清;从网上搜到的答案也是各执一词。终于在1990年DEC公司实验室的一篇论文中找到了较为权威的说法:冲突缺失,只在直接映射和组相连的cache中存在(在全相联cache中不存在),指的是cache中其他的set中还有空行,但某一set的全部way已经占满,不翻译 2015-11-30 17:52:33 · 3591 阅读 · 1 评论 -
GPUSim 的调试
GPUSim是 Nvidia GPU体系结构研究者的常用工具,设计者用各种容器、队列、类模拟了GPU的工作过程。 研究者可以通过阅读、修改其源代码来实现自己对GPU硬件或者调度策略的设计和改进,从而验证自己的设计对性能的影响。修改源码可能造成各种错误,尤其是逻辑错误无法在编译时发现,使得动态调试成为必要的研究手段。首先我们搞清Nvidia GPU通用计算的实现原理,和GPUSim的模拟原理原创 2016-05-26 12:39:12 · 1560 阅读 · 0 评论 -
openMPI多节点无法执行的问题
机房有多台HP服务器,有个任务计算量大,而且并行度高,非常适合并行计算,于是准备配置openMPI来做加速。创建ssh免密登陆、安装openMPI 1.65 都非常顺利,每个节点上单独运行例子都正常,诡异的是,一旦在命令中加入 --hostfile hosts 参数,指定多节点运行,马上出现bash: orted: 未找到命令-----------------------------...原创 2019-06-02 12:04:52 · 11299 阅读 · 3 评论 -
openMPI with CUDA
openMPI 1.7之后的版本才支持CUDA,建议下载最新的版本来获取最好的性能对于1.7~2.0的版本, 配置和编译、安装如下:sudo ./configure --prefix=<用户指定的openMPI的安装目录> --with-cuda=<cuda的include目录> --with-cuda-libdir=<cuda的lib64目录>s...原创 2019-06-07 22:41:09 · 3024 阅读 · 3 评论