- 博客(25)
- 资源 (2)
- 收藏
- 关注
原创 CUDA 编程 之 CUDA-MEMCHECK 工具 简介
CUDA-MEMCHECK1.IntroductionCUDA-MEMCHECK是一个在CUDA toolkit 中的功能性的正确性检查组件。**这个**suite有4个工具 :memcheckThe memcheck tool is capable of precisely detecting and attributing out of bounds and misaligned memory
2016-12-29 21:01:25 11122
原创 CUDA Program Analysis
Nvidia Visio profilernvprof ./app input file simple compile process.cu -> .ptx -> .cubin ->exeyou can use “nvcc -keep” to–ptxas-option=-v to see verbose compilation output
2016-12-29 09:05:44 1025
原创 CUDA 编程 之 cuda occupancy
Occupancy = Active Warps / Maximum Active WarpsRemember: resources are allocated for the entire block Resources are finiteUtilizing too many resources per thread may limit the occupancyPotential oc
2016-12-28 23:19:31 912
原创 GPU 架构基础
1. 费米架构 FERMI架构图SMSM Streaming multi-processors with multiple processing cores Each SM contains 32 processing coresExecutive in a Single Instruction Multi
2016-12-27 22:42:33 1827
原创 CACHE 逻辑架构和物理架构
1.逻辑架构32位地址2路组相连 当一个访问请求来时,即内存映射到缓存的地址,就是index位,先将内存位 的index部分索引到cache中的index,然后用tag部分相比较,然后得出是否命中的结论2.物理结构1)左侧为 TCAM ,主要存储tag array 的内容2)右侧为 SRAM ,主要存储data array 真实数据3. TCAM 原理 理解1)概念CAM是一种特殊的
2016-12-27 15:47:18 2880
原创 CPU访存机制理解
上图为已毕业使用毕业论文用图,引用一下缓存透明缓存对程序员是不可见的,当CPU发出访存请求的时候,在主存控制器中产生请求队列;然后主存控制器中调度器对请求进行调度;根据请求的内容不同可以分为命令,地址,和数据等。根据物理地址找到对应的bank,然后取出对应的某一行ROW,到Row Buffer 中,然后取出对应的某一列column,(到缓存中)然后CPU再访问。
2016-12-27 15:22:33 5259
原创 MSHR 理解
Miss Status Handling Registers 缺失状态保持寄存器 作用: keep track of outstanding misses 就是保存 misses 状态的轨迹信息的一个表Each MSHR contains enough state to handle one or more accesses of any type to single memory l
2016-12-27 15:17:35 2503 1
原创 GPU L1 data cache 特点
私有的,对于每个SM,no-blocking 非阻塞caching local & global memory access每个 SM 周期 可以处理 2个 access传入的内存请求,不能跨越 2 及以上的 cache lineL1D
2016-12-27 15:16:13 1840
原创 cache 写回策略
写回策略主要分两种: 写回(write back )和 写通(write through)1. write back只有在一个cache行被选中替换回主存时,如果cache 行的数据是修改过的(dirty),才将它写回主存。这种策略,要在Cache中设置一个脏位(dirty bit),用来表示缓存中的cache 行是否被修改过。如果 一个内存块在加载到Cache后未被修改过,Cache直接把该ca
2016-12-27 15:15:14 20455 8
原创 NVCC 分歩 编译 CUDA 程序
先上一张大图,nviDIA官方文档的编译流程图 完整的说明了如何从一个 .cu or .cpp 生成一个可执行的文件。1.只打印,不运行nvcc -O2 -c backprop_cuda.cu -keep -arch sm_30 --dryrun2.打印出 具体流程1. 读取环境变量#$ _SPACE_= #$ _CUDART_=cudart#$ _HERE_=/home/gpgpu-s
2016-12-25 14:05:06 4970
原创 Nvidia GPU 的存储架构 发展
查阅了好多论文,以及英伟达的白皮书,最后终于搞明白了。。从Fermi 到Pascal,cache 的体系结构发生了变化;1. Fermi ![这里写图片描述](http://img.blog.csdn.net/20161219223508426?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvZGFyazU2Njk=/font/5a6L
2016-12-19 14:48:42 3773
原创 U盘作为启动盘-恢复原来容量
一般我们用U盘做PE 的时候,会占用u盘500M到1G左右的空间,但是平常格式化的话,不会恢复。 我们在磁盘管理里可以看到,优盘未分配的空间,就是你要恢复的空间; windows 有个磁盘管理的命令,我们可以使用它来恢复我们的U盘空间; 1.打开cmd; 2.命令行下输入:diskpart 那么你就会发现,你已经进入了diskpart 这个目录(模块) 3.DISKPART>下,
2016-12-17 22:58:02 6595
原创 install JAVA8 on Debian8
本来在机子上装 clion ,结果报错说,java版本有点低;所以要用java8,然后找了一下教程,发现有个教程写的挺简单,用 的ubuntu 的 源,然后安装,下载的时候巨慢; 引用自: http://tecadmin.net/install-java-8-on-debian/#总结一下:添加源 打开/etc/sources.list 把下边的源添加进去 deb htt
2016-12-17 22:42:04 777
原创 ubuntu grub.cfg 丢失 进入 grub rescue>
看了网上的教程,最后自己也结一下 1.出现问题的原因 由于是win7+Ubuntu双系统,由Ubuntu来引导win7启动,本来想升级到win10,结果没成功,就连Ubuntu的引导项也丢失 2.解决方法 grub rescue下,,只能使用ls 和 set 两个命令 ls作用就是帮你找到Ubuntu的引导盘在哪, grub rescue> ls 显示(hd0,),(hd0,msdos
2016-12-17 22:11:36 1891
原创 sogou-input install for debian
1.install fcitxapt-get install fcitx2.install sogou-inputsudo dpkg -i sogoupinyin_2.0.0.0078_amd64.deb3.dependency installsudo apt-get install -f
2016-12-15 13:45:20 438
原创 install crossover &qq
install i386 lib dependencysudo dpkg --add-architecture i386sudo apt-get update// 可能需要添加下列32位库sudo apt-get install lib32z1 lib32ncurses5install crossoverdpkg -i crossover-15_15.0.3-1_all.deb//miss
2016-12-15 13:33:28 1166
原创 software install of debian
1.add shortcuts of terminalall settings-->keyboard-->shortcuts-->addname :Terminalcommand :gnome-terminaldisabled-->CTRL+ALT_T2.Add your count to sudoergedit /etc/sudoersadd your count later of ro
2016-12-15 13:02:21 469
转载 GPGPU-Sim 之 提高运行benchmark的速度(转载整理)
本博客是基于《大光叔叔的专栏》中《GPGPU-Sim(番外)-如何加快GPGPU-Sim的运行速度》的方案四做的; 链接请点击:> http://blog.csdn.net/litdaguang/article/details/50002325对于出入GPGPU-Sim坑的小白们,可能ubuntu 还没用熟呢,就要做各种实验了,可是用官方提供的虚拟机就太耗时间了,幸亏看到了大光的这篇文章,觉得世界
2016-12-13 12:42:53 1945
原创 cache 中几个概念的理解
coherence:着重强调,某个数据的变化,在存储的各个位置的一致性,对于每个访问它的进程 数值相同。consistency强调的是,这段程序执行的先后顺序,在严格的模型下,顺序必须是固定的,否则会被认为出错; 相对的,也有宽松的模型,,inclusive:表达的是,上层存储的数据,完全包含于其下一级存储。举个例子,L1cache中的数据,L2都有non-inclusive与上边的相反,上层的数
2016-12-11 14:37:08 2872
原创 How to Run Benchmarks in GPGPU-Sim 3.2.2
1.在home目录下运行的方法./run_gpgpu-sim.sh ~/cuda/sdk/4.2/C/bin/linux/release/vectorAdd 2.在benchmark 目录下运行的方法../bin/release/NN 28../bin/release/MUM ./data/NC_003997.20k.fna ./data/NC_003997_q25bp.50k.fna../bin/
2016-12-10 09:59:52 928
原创 ubuntu 16.04 自动生成的grub 存一下
```## DO NOT EDIT THIS FILE## It is automatically generated by grub-mkconfig using templates# from /etc/grub.d and settings from /etc/default/grub#### BEGIN /etc/grub.d/00_header ###if [ -s $pre
2016-12-09 23:42:18 1701
原创 debian 常见问题
1.初始化 声卡 治疗debian没声音sudo alsactl init 2.输入法问题: 配置输入法fcitx-config-gtk3 3.修改语言设置安装debian 的时候选择了中文zh_CN_UTF-8,然后进系统后想换成en_US_UTF-8可以使用一下命令选择:找到需要的语言 用空格选定即可dpkg-reconfigure locales4.虚拟机共享文件夹权限问题将用户添加到 vb
2016-12-09 23:37:13 728
原创 ubuntu 静态ip设置
两种方法:1.直接命令行设置,但是重启后失效设置IP 和 子网掩码sudo ifconfig eth1 211.87.235.204 netmask 255.255.255.0设置网关sudo route add default gw 211.87.235.12.在 debian 默认配置文件里修改/etc/network/interfaces设置 ip 掩码 网关#开机自动激活 eth0
2016-12-09 23:36:10 298
原创 linux 查看版本信息
1. 查看内核版本命令:1)cat /proc/versionLinux version 3.16.0-4-amd64 (debian-kernel@lists.debian.org) (gcc version 4.8.4 (Debian 4.8.4-1) ) #1 SMP Debian 3.16.36-1+deb8u1 (2016-09-03)2) uname -a Linux zangcq
2016-12-09 23:33:21 1196
原创 win10+ubuntu系统迁移到SSD
1.windows实验室这次搞了几块三星的ssd,型号是:三星(SAMSUNG) 850 EVO 250G SATA3 固态硬盘 三星有个sangsung magician 的软件,可以直接支持系统拷贝,这次就不细说了2.ubuntu其实原理很简单,划好分区,直接从机械盘,复制到ssd就好了。。。然后把grub对应修改就好了;中间出了个小插曲,浪费了大好时间cp 的时候 没加 -
2016-12-09 23:31:33 7090 2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人