GPU
FishSeeker
这个作者很懒,什么都没留下…
展开
-
安装CUDA
嗯,本渣又回到了科研道路上了。这次讲讲怎么安装CUDA原创 2017-06-29 10:14:57 · 2642 阅读 · 2 评论 -
Ubuntu\Win导入CUDA项目
使用nsight导入非nsight的cuda项目原创 2018-03-07 09:41:42 · 470 阅读 · 2 评论 -
Parboil使用说明
写在最前Parboil是一个多平台的Benchmark,官网在这里,这篇博文对如何编译该benchmark做简要描述下载从上面官网,需要把benchmark源码,driver,还有datasets都下载下来,然后解压driver文件会得到一个parboil文件夹,将下载得到的benchmark源码文件夹,datasets文件夹放到这个文件夹中,命名分别为benchmarks 和 d...原创 2018-03-08 09:26:32 · 1469 阅读 · 6 评论 -
剖析NVIDIA Volta架构之指令篇
翻译自Dissecting the NVIDIA Volta GPU Architecture via Microbenchmarking翻译 2018-05-07 14:53:55 · 2321 阅读 · 6 评论 -
在docker里跑gpgpusim
1. Introductiongpgpusim在虚拟机里跑起来非常慢,而自己配机器的环境又可能会出现这样那样的问题。本文给出了一种使用gpgpusim提供的vbox虚拟机进行编译,在host的docker环境下运行的方法。2. 使用gpgpusim官方vbox虚拟机gpgpusim官方提供了vbox虚拟机文件的下载,大概7G多,http://ece.ubc.ca/~tayler...转载 2018-07-04 16:17:26 · 948 阅读 · 0 评论 -
virtualbox-tx2刷jetpack3.2
1. Introduction本文介绍了使用virtualbox里的Ubuntu16.04作为Host来刷jetson tx2的jetpack3.2包的过程。可有效解决Install JetPack 3.2 Failed “E: fopen failed with file local.db, errno = 2”的问题。2. 环境介绍PC的真正Host是Debian9Virt...转载 2018-07-19 14:50:37 · 1758 阅读 · 0 评论 -
在tx2上安装opencv和cuDNN
cuDNN从 https://developer.nvidia.com/rdp/cudnn-archive 这个网址下载指定的cudnn版本,这里注意如果直接google然后下载的话只是最新版本,需要点击下面的Archived cuDNN Releases才能够找到以前版本的下载,然后选择cuDNN v×.× Library for Linux下载下来一个压缩文件。将其解压到某个目录下执行...原创 2018-07-21 16:17:51 · 3437 阅读 · 4 评论 -
Arm GPU Mali简介
ARM GPU Mali架构简介原创 2018-12-05 22:01:09 · 8216 阅读 · 0 评论 -
MALI Tile-based rendering简单原理介绍
关于MALI所使用的tile-based架构的解释翻译 2018-12-20 16:13:51 · 5013 阅读 · 4 评论 -
CUDA Samples
NVIDIA官方文档《CUDA Samples》翻译 2017-08-05 10:47:32 · 14654 阅读 · 12 评论 -
CUDA PTX ISA阅读笔记(一)
Parallel Thread Execution ISA Version 5.0. 官方文档的阅读笔记,希望对这方面的同学有所帮助原创 2017-07-17 09:34:23 · 11077 阅读 · 0 评论 -
《GPU高性能编程 CUDA实战》(CUDA By Example)读书笔记
入门书籍,十分简单,看完就可以编写一些简单的CUDA程序了原创 2017-07-13 21:38:21 · 18398 阅读 · 5 评论 -
零拷贝内存 or 页锁定内存
这是一个小实验,在于验证GPU上使用零拷贝内存和页锁定内存的性能差别。原创 2017-07-17 22:05:36 · 2454 阅读 · 1 评论 -
使用cuda-gdb调试cu程序
初学cuda可以尝试一下原创 2017-07-03 14:08:48 · 6491 阅读 · 0 评论 -
CUDA PTX ISA阅读笔记(二)
第八章的命令原创 2017-07-20 10:06:48 · 5831 阅读 · 3 评论 -
CUDA C最佳实践-CUDA Best Practices(一)
CUDA官方文档 CUDA C最佳实践(CUDA Best Practices)翻译的第一部分翻译 2017-08-08 14:32:02 · 2109 阅读 · 4 评论 -
CUDA C最佳实践-CUDA Best Practices(二)
CUDA Best Practices第二部分,主要讲内存优化翻译 2017-08-08 16:16:58 · 1167 阅读 · 0 评论 -
并行计算中的Amdahl与Gustafson定律
Amdahl定律和Gustafson定律转载 2017-08-02 22:33:31 · 1829 阅读 · 0 评论 -
CUDA C最佳实践-CUDA Best Practices(三)
CUDA Best Practices的第三部分翻译 2017-08-08 16:17:46 · 2174 阅读 · 0 评论 -
手动编译Parboil
利用修改makefile手动编译Parboil,而不是用它提供的脚本原创 2019-03-18 15:07:00 · 552 阅读 · 2 评论