自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

This is Chuanqiz's Blog

记录与分享

  • 博客(25)
  • 资源 (2)
  • 收藏
  • 关注

原创 CUDA 编程 之 CUDA-MEMCHECK 工具 简介

CUDA-MEMCHECK1.IntroductionCUDA-MEMCHECK是一个在CUDA toolkit 中的功能性的正确性检查组件。**这个**suite有4个工具 :memcheckThe memcheck tool is capable of precisely detecting and attributing out of bounds and misaligned memory

2016-12-29 21:01:25 11122

原创 CUDA Program Analysis

Nvidia Visio profilernvprof ./app input file simple compile process.cu -> .ptx -> .cubin ->exeyou can use “nvcc -keep” to–ptxas-option=-v to see verbose compilation output​

2016-12-29 09:05:44 1025

原创 CUDA 编程 之 cuda occupancy

Occupancy = Active Warps / Maximum Active WarpsRemember: resources are allocated for the entire block Resources are finiteUtilizing too many resources per thread may limit the occupancyPotential oc

2016-12-28 23:19:31 912

原创 GPU 架构基础

1. 费米架构 FERMI架构图SMSM Streaming multi-processors with multiple processing cores Each SM contains 32 processing coresExecutive in a Single Instruction Multi

2016-12-27 22:42:33 1827

原创 CACHE 逻辑架构和物理架构

1.逻辑架构32位地址2路组相连 当一个访问请求来时,即内存映射到缓存的地址,就是index位,先将内存位 的index部分索引到cache中的index,然后用tag部分相比较,然后得出是否命中的结论2.物理结构1)左侧为 TCAM ,主要存储tag array 的内容2)右侧为 SRAM ,主要存储data array 真实数据3. TCAM 原理 理解1)概念CAM是一种特殊的

2016-12-27 15:47:18 2880

原创 CPU访存机制理解

上图为已毕业使用毕业论文用图,引用一下缓存透明缓存对程序员是不可见的,当CPU发出访存请求的时候,在主存控制器中产生请求队列;然后主存控制器中调度器对请求进行调度;根据请求的内容不同可以分为命令,地址,和数据等。根据物理地址找到对应的bank,然后取出对应的某一行ROW,到Row Buffer 中,然后取出对应的某一列column,(到缓存中)然后CPU再访问。

2016-12-27 15:22:33 5259

原创 MSHR 理解

Miss Status Handling Registers 缺失状态保持寄存器 作用: keep track of outstanding misses 就是保存 misses 状态的轨迹信息的一个表Each MSHR contains enough state to handle one or more accesses of any type to single memory l

2016-12-27 15:17:35 2503 1

原创 GPU L1 data cache 特点

私有的,对于每个SM,no-blocking 非阻塞caching local & global memory access每个 SM 周期 可以处理 2个 access传入的内存请求,不能跨越 2 及以上的 cache lineL1D

2016-12-27 15:16:13 1840

原创 cache 写回策略

写回策略主要分两种: 写回(write back )和 写通(write through)1. write back只有在一个cache行被选中替换回主存时,如果cache 行的数据是修改过的(dirty),才将它写回主存。这种策略,要在Cache中设置一个脏位(dirty bit),用来表示缓存中的cache 行是否被修改过。如果 一个内存块在加载到Cache后未被修改过,Cache直接把该ca

2016-12-27 15:15:14 20455 8

原创 NVCC 分歩 编译 CUDA 程序

先上一张大图,nviDIA官方文档的编译流程图 完整的说明了如何从一个 .cu or .cpp 生成一个可执行的文件。1.只打印,不运行nvcc -O2 -c backprop_cuda.cu -keep -arch sm_30 --dryrun2.打印出 具体流程1. 读取环境变量#$ _SPACE_= #$ _CUDART_=cudart#$ _HERE_=/home/gpgpu-s

2016-12-25 14:05:06 4970

原创 Nvidia GPU 的存储架构 发展

查阅了好多论文,以及英伟达的白皮书,最后终于搞明白了。。从Fermi 到Pascal,cache 的体系结构发生了变化;1. Fermi ![这里写图片描述](http://img.blog.csdn.net/20161219223508426?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvZGFyazU2Njk=/font/5a6L

2016-12-19 14:48:42 3773

原创 U盘作为启动盘-恢复原来容量

一般我们用U盘做PE 的时候,会占用u盘500M到1G左右的空间,但是平常格式化的话,不会恢复。 我们在磁盘管理里可以看到,优盘未分配的空间,就是你要恢复的空间; windows 有个磁盘管理的命令,我们可以使用它来恢复我们的U盘空间; 1.打开cmd; 2.命令行下输入:diskpart 那么你就会发现,你已经进入了diskpart 这个目录(模块) 3.DISKPART>下,

2016-12-17 22:58:02 6595

原创 install JAVA8 on Debian8

本来在机子上装 clion ,结果报错说,java版本有点低;所以要用java8,然后找了一下教程,发现有个教程写的挺简单,用 的ubuntu 的 源,然后安装,下载的时候巨慢; 引用自: http://tecadmin.net/install-java-8-on-debian/#总结一下:添加源 打开/etc/sources.list 把下边的源添加进去 deb htt

2016-12-17 22:42:04 777

原创 ubuntu grub.cfg 丢失 进入 grub rescue>

看了网上的教程,最后自己也结一下 1.出现问题的原因 由于是win7+Ubuntu双系统,由Ubuntu来引导win7启动,本来想升级到win10,结果没成功,就连Ubuntu的引导项也丢失 2.解决方法 grub rescue下,,只能使用ls 和 set 两个命令 ls作用就是帮你找到Ubuntu的引导盘在哪, grub rescue> ls 显示(hd0,),(hd0,msdos

2016-12-17 22:11:36 1891

原创 sogou-input install for debian

1.install fcitxapt-get install fcitx2.install sogou-inputsudo dpkg -i sogoupinyin_2.0.0.0078_amd64.deb3.dependency installsudo apt-get install -f

2016-12-15 13:45:20 438

原创 install crossover &qq

install i386 lib dependencysudo dpkg --add-architecture i386sudo apt-get update// 可能需要添加下列32位库sudo apt-get install lib32z1 lib32ncurses5install crossoverdpkg -i crossover-15_15.0.3-1_all.deb//miss

2016-12-15 13:33:28 1166

原创 software install of debian

1.add shortcuts of terminalall settings-->keyboard-->shortcuts-->addname :Terminalcommand :gnome-terminaldisabled-->CTRL+ALT_T2.Add your count to sudoergedit /etc/sudoersadd your count later of ro

2016-12-15 13:02:21 469

转载 GPGPU-Sim 之 提高运行benchmark的速度(转载整理)

本博客是基于《大光叔叔的专栏》中《GPGPU-Sim(番外)-如何加快GPGPU-Sim的运行速度》的方案四做的; 链接请点击:> http://blog.csdn.net/litdaguang/article/details/50002325对于出入GPGPU-Sim坑的小白们,可能ubuntu 还没用熟呢,就要做各种实验了,可是用官方提供的虚拟机就太耗时间了,幸亏看到了大光的这篇文章,觉得世界

2016-12-13 12:42:53 1945

原创 cache 中几个概念的理解

coherence:着重强调,某个数据的变化,在存储的各个位置的一致性,对于每个访问它的进程 数值相同。consistency强调的是,这段程序执行的先后顺序,在严格的模型下,顺序必须是固定的,否则会被认为出错; 相对的,也有宽松的模型,,inclusive:表达的是,上层存储的数据,完全包含于其下一级存储。举个例子,L1cache中的数据,L2都有non-inclusive与上边的相反,上层的数

2016-12-11 14:37:08 2872

原创 How to Run Benchmarks in GPGPU-Sim 3.2.2

1.在home目录下运行的方法./run_gpgpu-sim.sh ~/cuda/sdk/4.2/C/bin/linux/release/vectorAdd 2.在benchmark 目录下运行的方法../bin/release/NN 28../bin/release/MUM ./data/NC_003997.20k.fna ./data/NC_003997_q25bp.50k.fna../bin/

2016-12-10 09:59:52 928

原创 ubuntu 16.04 自动生成的grub 存一下

```## DO NOT EDIT THIS FILE## It is automatically generated by grub-mkconfig using templates# from /etc/grub.d and settings from /etc/default/grub#### BEGIN /etc/grub.d/00_header ###if [ -s $pre

2016-12-09 23:42:18 1701

原创 debian 常见问题

1.初始化 声卡 治疗debian没声音sudo alsactl init 2.输入法问题: 配置输入法fcitx-config-gtk3 3.修改语言设置安装debian 的时候选择了中文zh_CN_UTF-8,然后进系统后想换成en_US_UTF-8可以使用一下命令选择:找到需要的语言 用空格选定即可dpkg-reconfigure locales4.虚拟机共享文件夹权限问题将用户添加到 vb

2016-12-09 23:37:13 728

原创 ubuntu 静态ip设置

两种方法:1.直接命令行设置,但是重启后失效设置IP 和 子网掩码sudo ifconfig eth1 211.87.235.204 netmask 255.255.255.0设置网关sudo route add default gw 211.87.235.12.在 debian 默认配置文件里修改/etc/network/interfaces设置 ip 掩码 网关#开机自动激活 eth0

2016-12-09 23:36:10 298

原创 linux 查看版本信息

1. 查看内核版本命令:1)cat /proc/versionLinux version 3.16.0-4-amd64 (debian-kernel@lists.debian.org) (gcc version 4.8.4 (Debian 4.8.4-1) ) #1 SMP Debian 3.16.36-1+deb8u1 (2016-09-03)2) uname -a Linux zangcq

2016-12-09 23:33:21 1196

原创 win10+ubuntu系统迁移到SSD

1.windows实验室这次搞了几块三星的ssd,型号是:三星(SAMSUNG) 850 EVO 250G SATA3 固态硬盘 三星有个sangsung magician 的软件,可以直接支持系统拷贝,这次就不细说了2.ubuntu其实原理很简单,划好分区,直接从机械盘,复制到ssd就好了。。。然后把grub对应修改就好了;中间出了个小插曲,浪费了大好时间cp 的时候 没加 -

2016-12-09 23:31:33 7090 2

并行程序设计

并行程序设计PPT,与并行程序设计配套使用.

2015-11-06

opencv中文版

图像处理,专业用于图像处理,视频检测,摄像头应用等

2013-03-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除