2017年02月___DARK__

12月 11月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创 PTX ISA 之 volatile 的用法

字面意思挥发性的，不稳定的用法用于ld/st指令ld.volatile{.ss}.type d, [a]; // load from address ld.volatile{.ss}.vec.type d, [a]; // vector load from addrAn ld.volatile operation is always performed and it will not be r

2017-02-28 23:30:10 738

原创本人同步文档工具小计

githubgit add × //添加更改git commit //提交修改文档git push origin // 推到git 上有道云笔记需要手动拷贝百度云盘同步较大的文档goole 网盘mega比较重要的code

2017-02-28 14:42:40 288

原创 PTX ISA 之 comparisions 小结

http://docs.nvidia.com/cuda/parallel-thread-execution/index.html#comparisonsinteger meaning signed op unsigned op bit-size op a == b eq eq eq a != b ne ne ne a < b lt l

2017-02-28 13:52:45 456

原创 CUDA 编程之配置cache函数

设置L1/shared mem 配置函数Sets the preferred cache configuration for a device function.__host__ cudaError_t cudaFuncSetCacheConfig ( const void* func, cudaFuncCache cacheConfig ) 枚举参数enum cudaFuncCache CUD

2017-02-27 21:49:15 1762

原创 Linux 打包_解压命令

Linux 打包_解压命令文件类型命令以实例备注 .tar tar xvf FileName.tar 解包 tar cvf FileName.tar DirName 打包 .gz gzip -d FileName.gz 解压 gzip FileName 压缩 tar.gz / .tgz tar zx

2017-02-26 15:59:29 305

转载 GPU架构基础之 Unified L1/Texture Cache in Pascal

Unified L1/Texture Cache in PascalLike Maxwell, Pascal combines the functionality of the L1 and texture caches into a unified L1/Texture cache which acts as a coalescing buffer for memory accesses, gat

2017-02-26 15:27:57 1121

原创关于虚拟机中几种网络模式小结

不管是在 VBOX 还是 VMWARE中，我们大多采用这几种网络连接方式进行虚拟的网络访问：1.NAT（nerwork address translation 网络地址转换）2.桥接网卡3.host only(主机模式)在今天之前，我也对这几种方式不是太了解，因为一个哥们说，虚拟机不能上网了，让我过去看看，便自己就详细的了解了一下，因此记之。此博客讲的不错，不少借鉴，自己也略有发挥 http:

2017-02-23 21:26:52 1196

原创 printf in CUDA kernel 函数

摘自《cuda-c-programming-guide》B.17. Formatted Output http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#formatted-output格式化输出仅由计算能力2.x或更高的设备支持。int printf(const char *format[, arg, ...]);e

2017-02-22 23:05:45 10571

原创走进shell 2

2.1 进入命令行在出现图形化界面之前，与Unix系统交互的唯一方式就是借助 shell 所提供的文本命令行界面 command line interface ,CLI。CLI只能接受文本输入，也只能显示出文本和基本的图形输出。2.1.1 控制台终端在Ubuntu或者debian 下，Ctrl+Alt+F1~F6 是控制台终端，tty1~6 代表电传打字机（teletypewriter）.这是一

2017-02-20 15:21:55 351

原创便笺存储器（Scratchpad Memory）

概念SPM 是由 SRAM 存储部件 + 地址译码部件 + 数据输出电路三个部分构成，使用片上高速总线和处理器连接；一般 Cache 中，不仅有SRAM存储单元等三部分，通常还包含 TagRAM 部件和比较逻辑电路部件，所以相对SPM 访问延迟和能耗略高。特点SPM和主存统一编址，具有和主存统一的不重叠的地址空间。不需要TagRAM部件就可以直接访问SPM中的数据。对比于Cache

2017-02-20 15:19:22 14896 1

原创 makedepend 命令

参考文章来自 IBM Knowledge Center 请点击用途在makefile中创建相关性语法makedepend [ -DName=Def] [ -DName] [ -IIncludeDir ] [ -YIncludeDir ] [ -a ] [ -fMakeFile ] [ -oObjSuffix ] [ -pObjPrefix ] [ -sString ] [ -wWidth ] [

2017-02-19 18:52:50 3141

原创 what is a data race？

什么是 data race?data race 发生的充分条件1.两个或者更多线程在一个程序中，并发的访问同一数据；2.至少一个访问是写操作；3.这些线程都不使用任何互斥锁来控制这些访问。#当上面这些条件发生时，访问的顺序是不确定的，并且基于这些不同的运行顺序会导致计算产生不同的结果（这些结果也是正确的）。一些data race 是良性的，但是更多的是会产生程序的bug。https://docs

2017-02-15 14:46:54 1117

原创安装cuda 8.0

1.卸载本机原有驱动，因为通常ubuntu或者debian都是来自社区的驱动，并不是英伟达的官方驱动如何完全卸载 nvidia驱动 http://forums.debian.net/viewtopic.php?f=10&t=55518aptitude purge ~i~nnvidia2.从官网下载对应显卡驱动程序，进行安装安装详见： http://blog.csdn.net/dark5669

2017-02-14 10:00:04 4464

原创解析GPU cache 中读写操作及其事件

基于GPGPU-SIM代码，对读写操作进行解析1.对于cache不应用写回策略的发送读请求/// Read miss handler without writebackvoid baseline_cache::send_read_request(new_addr_type addr, new_addr_type block_addr, unsigned cache_index, mem_fetch

2017-02-12 22:39:45 2813

并行程序设计

并行程序设计PPT，与并行程序设计配套使用.

2015-11-06

opencv中文版

图像处理，专业用于图像处理，视频检测，摄像头应用等

2013-03-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人