- 博客(14)
- 资源 (2)
- 收藏
- 关注
原创 PTX ISA 之 volatile 的用法
字面意思挥发性的,不稳定的用法用于ld/st指令ld.volatile{.ss}.type d, [a]; // load from address ld.volatile{.ss}.vec.type d, [a]; // vector load from addrAn ld.volatile operation is always performed and it will not be r
2017-02-28 23:30:10 738
原创 本人同步文档工具小计
githubgit add × //添加更改git commit //提交修改文档git push origin // 推到git 上有道云笔记需要手动 拷贝百度云盘同步较大的文档goole 网盘mega比较重要的code
2017-02-28 14:42:40 288
原创 PTX ISA 之 comparisions 小结
http://docs.nvidia.com/cuda/parallel-thread-execution/index.html#comparisonsinteger meaning signed op unsigned op bit-size op a == b eq eq eq a != b ne ne ne a < b lt l
2017-02-28 13:52:45 456
原创 CUDA 编程 之 配置cache函数
设置L1/shared mem 配置函数Sets the preferred cache configuration for a device function.__host__ cudaError_t cudaFuncSetCacheConfig ( const void* func, cudaFuncCache cacheConfig ) 枚举参数enum cudaFuncCache CUD
2017-02-27 21:49:15 1762
原创 Linux 打包_解压命令
Linux 打包_解压命令 文件类型 命令以实例 备注 .tar tar xvf FileName.tar 解包 tar cvf FileName.tar DirName 打包 .gz gzip -d FileName.gz 解压 gzip FileName 压缩 tar.gz / .tgz tar zx
2017-02-26 15:59:29 305
转载 GPU架构基础 之 Unified L1/Texture Cache in Pascal
Unified L1/Texture Cache in PascalLike Maxwell, Pascal combines the functionality of the L1 and texture caches into a unified L1/Texture cache which acts as a coalescing buffer for memory accesses, gat
2017-02-26 15:27:57 1121
原创 关于虚拟机中几种网络模式小结
不管是在 VBOX 还是 VMWARE中,我们大多采用这几种网络连接方式进行虚拟的网络访问:1.NAT(nerwork address translation 网络地址转换)2.桥接网卡3.host only(主机模式)在今天之前,我也对这几种方式不是太了解,因为一个哥们说,虚拟机不能上网了,让我过去看看,便自己就详细的了解了一下,因此记之。此博客讲的不错,不少借鉴,自己也略有发挥 http:
2017-02-23 21:26:52 1196
原创 printf in CUDA kernel 函数
摘自《cuda-c-programming-guide》B.17. Formatted Output http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#formatted-output格式化输出仅由计算能力2.x或更高的设备支持。int printf(const char *format[, arg, ...]);e
2017-02-22 23:05:45 10571
原创 走进shell 2
2.1 进入命令行在出现图形化界面之前,与Unix系统交互的唯一方式就是借助 shell 所提供的文本命令行界面 command line interface ,CLI。CLI只能接受文本输入,也只能显示出文本和基本的图形输出。2.1.1 控制台终端在Ubuntu或者debian 下,Ctrl+Alt+F1~F6 是控制台终端,tty1~6 代表电传打字机(teletypewriter).这是一
2017-02-20 15:21:55 351
原创 便笺存储器(Scratchpad Memory)
概念SPM 是由 SRAM 存储部件 + 地址译码部件 + 数据输出电路 三个部分构成,使用片上高速总线 和 处理器 连接;一般 Cache 中 ,不仅有SRAM存储单元等三部分,通常还包含 TagRAM 部件 和 比较逻辑电路部件,所以相对SPM 访问延迟和能耗略高。特点SPM和主存统一编址, 具有和主存统一的不重叠的地址空间。不需要TagRAM部件就可以直接访问SPM中的数据。对比于Cache
2017-02-20 15:19:22 14896 1
原创 makedepend 命令
参考文章来自 IBM Knowledge Center 请点击用途在makefile中创建相关性语法makedepend [ -DName=Def] [ -DName] [ -IIncludeDir ] [ -YIncludeDir ] [ -a ] [ -fMakeFile ] [ -oObjSuffix ] [ -pObjPrefix ] [ -sString ] [ -wWidth ] [
2017-02-19 18:52:50 3141
原创 what is a data race?
什么是 data race?data race 发生的充分条件1.两个或者更多线程在一个程序中,并发的访问同一数据;2.至少一个访问是写操作;3.这些线程都不使用任何互斥锁来控制这些访问。#当上面这些条件发生时,访问的顺序是不确定的,并且基于这些不同的运行顺序会导致计算产生不同的结果(这些结果也是正确的)。一些data race 是良性的,但是更多的是会产生程序 的bug。https://docs
2017-02-15 14:46:54 1117
原创 安装cuda 8.0
1.卸载本机原有驱动,因为 通常ubuntu或者debian都是来自社区的驱动,并不是英伟达的官方驱动如何完全 卸载 nvidia驱动 http://forums.debian.net/viewtopic.php?f=10&t=55518aptitude purge ~i~nnvidia2.从官网下载对应显卡驱动程序,进行安装安装详见: http://blog.csdn.net/dark5669
2017-02-14 10:00:04 4464
原创 解析GPU cache 中读写操作及其事件
基于GPGPU-SIM代码,对读写操作进行解析1.对于cache不应用写回策略的发送读请求/// Read miss handler without writebackvoid baseline_cache::send_read_request(new_addr_type addr, new_addr_type block_addr, unsigned cache_index, mem_fetch
2017-02-12 22:39:45 2813
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人