This is Chuanqi‘s Blog

记录与分享 http://www.zangcq.com

CUDA 编程 之 CUDA-MEMCHECK 工具 简介

CUDA-MEMCHECK1.IntroductionCUDA-MEMCHECK是一个在CUDA toolkit 中的功能性的正确性检查组件。**这个**suite有4个工具 :memcheckThe memcheck tool is capable of precisely detecting ...

2016-12-29 21:01:25

阅读数 2464

评论数 0

CUDA Program Analysis

Nvidia Visio profilernvprof ./app input file simple compile process.cu -> .ptx -> .cubin ->exeyou can use “nvcc ...

2016-12-29 09:05:44

阅读数 454

评论数 0

CUDA 编程 之 cuda occupancy

Occupancy = Active Warps / Maximum Active Warps Remember: resources are allocated for the entire block Resources are finite Utilizing too many resou...

2016-12-28 23:19:31

阅读数 449

评论数 0

GPU 架构基础

1. 费米架构 FERMI架构图SM SM Streaming multi-processors with multiple processing cores Each SM contains 32 proc...

2016-12-27 22:42:33

阅读数 1266

评论数 0

CACHE 逻辑架构和物理架构

1.逻辑架构 32位地址 2路组相连 当一个访问请求来时,即内存映射到缓存的地址,就是index位,先将内存位 的index部分索引到cache中的index,然后用tag部分相比较,然后得出是否命中的结论 2.物理结构1)左侧为 TCAM ,主要存储tag array 的内容 2)右侧为 S...

2016-12-27 15:47:18

阅读数 1352

评论数 0

CPU访存机制理解

上图为已毕业使用毕业论文用图,引用一下缓存透明缓存对程序员是不可见的,当CPU发出访存请求的时候,在主存控制器中产生请求队列;然后主存控制器中调度器对请求进行调度;根据请求的内容不同可以分为命令,地址,和数据等。根据物理地址找到对应的bank,然后取出对应的某一行ROW,到Row Buffer 中...

2016-12-27 15:22:33

阅读数 1252

评论数 0

MSHR 理解

Miss Status Handling Registers 缺失状态保持寄存器 作用: keep track of outstanding misses 就是保存 misses 状态的轨迹信息的一个表Each MSHR contains enough state to handle...

2016-12-27 15:17:35

阅读数 576

评论数 1

GPU L1 data cache 特点

私有的,对于每个SM,no-blocking 非阻塞 caching local & global memory access 每个 SM 周期 可以处理 2个 access 传入的内存请求,不能跨越 2 及以上的 cache line L1D

2016-12-27 15:16:13

阅读数 615

评论数 0

cache 写回策略

写回策略主要分两种: 写回(write back )和 写通(write through)1. write back只有在一个cache行被选中替换回主存时,如果cache 行的数据是修改过的(dirty),才将它写回主存。这种策略,要在Cache中设置一个脏位(dirty bit),用来表示缓...

2016-12-27 15:15:14

阅读数 6240

评论数 0

NVCC 分歩 编译 CUDA 程序

先上一张大图,nviDIA官方文档的编译流程图 完整的说明了如何从一个 .cu or .cpp 生成一个可执行的文件。1.只打印,不运行nvcc -O2 -c backprop_cuda.cu -keep -arch sm_30 --dryrun2.打印出 具体流程1. 读取环境变量 #$ ...

2016-12-25 14:05:06

阅读数 2772

评论数 0

Nvidia GPU 的存储架构 发展

查阅了好多论文,以及英伟达的白皮书,最后终于搞明白了。。从Fermi 到Pascal,cache 的体系结构发生了变化;1. Fermi ![这里写图片描述](http://img.blog.csdn.net/20161219223508426?watermark/2/tex...

2016-12-19 14:48:42

阅读数 2184

评论数 0

U盘作为启动盘-恢复原来容量

一般我们用U盘做PE 的时候,会占用u盘500M到1G左右的空间,但是平常格式化的话,不会恢复。 我们在磁盘管理里可以看到,优盘未分配的空间,就是你要恢复的空间; windows 有个磁盘管理的命令,我们可以使用它来恢复我们的U盘空间; 1.打开cmd; 2.命令行下输入:diskpart...

2016-12-17 22:58:02

阅读数 2810

评论数 0

install JAVA8 on Debian8

本来在机子上装 clion ,结果报错说,java版本有点低;所以要用java8,然后找了一下教程,发现有个教程写的挺简单,用 的ubuntu 的 源,然后安装,下载的时候巨慢; 引用自: http://tecadmin.net/install-java-8-on-debian/# ...

2016-12-17 22:42:04

阅读数 432

评论数 0

ubuntu grub.cfg 丢失 进入 grub rescue>

看了网上的教程,最后自己也结一下 1.出现问题的原因 由于是win7+Ubuntu双系统,由Ubuntu来引导win7启动,本来想升级到win10,结果没成功,就连Ubuntu的引导项也丢失 2.解决方法 grub rescue下,,只能使用ls 和 set 两个命令 ls作用就是帮你找...

2016-12-17 22:11:36

阅读数 786

评论数 0

sogou-input install for debian

1.install fcitxapt-get install fcitx 2.install sogou-inputsudo dpkg -i sogoupinyin_2.0.0.0078_amd64.deb 3.dependency installsudo apt-get install -f

2016-12-15 13:45:20

阅读数 278

评论数 0

install crossover &qq

install i386 lib dependencysudo dpkg --add-architecture i386 sudo apt-get update // 可能需要添加下列32位库 sudo apt-get install lib32z1 lib32ncurses5 install c...

2016-12-15 13:33:28

阅读数 888

评论数 0

software install of debian

1.add shortcuts of terminalall settings-->keyboard-->shortcuts-->addname :Terminal command :gnome-terminal disabled-->CTRL+ALT_T 2.Add yo...

2016-12-15 13:02:21

阅读数 318

评论数 0

GPGPU-Sim 之 提高运行benchmark的速度(转载整理)

本博客是基于《大光叔叔的专栏》中《GPGPU-Sim(番外)-如何加快GPGPU-Sim的运行速度》的方案四做的; 链接请点击:> http://blog.csdn.net/litdaguang/article/details/50002325对于出入GPGPU-Sim坑的小白们,可能ub...

2016-12-13 12:42:53

阅读数 838

评论数 0

cache 中几个概念的理解

coherence:着重强调,某个数据的变化,在存储的各个位置的一致性,对于每个访问它的进程 数值相同。consistency强调的是,这段程序执行的先后顺序,在严格的模型下,顺序必须是固定的,否则会被认为出错; 相对的,也有宽松的模型,,inclusive:表达的是,上层存储的数据,完全包含于...

2016-12-11 14:37:08

阅读数 774

评论数 0

How to Run Benchmarks in GPGPU-Sim 3.2.2

1.在home目录下运行的方法./run_gpgpu-sim.sh ~/cuda/sdk/4.2/C/bin/linux/release/vectorAdd 2.在benchmark 目录下运行的方法../bin/release/NN 28../bin/release/MUM ./data/NC_...

2016-12-10 09:59:52

阅读数 498

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭