CUDA
文章平均质量分 76
风铃Ryan
这个作者很懒,什么都没留下…
展开
-
组成:GPU与CPU的比较
GPU与CPU的比较不管是CPU还是GPU都是很高速的设备,然而从主存中取数据会很慢很慢,为了充分利用高速设备,二者都使用了缓存,编程一定要考虑的是计算机程序的局部性(locality)的基本属性—–时间局部性与空间局部性。多核时代和GPU并行运算时代来临,另外一个影响程序运行的速度的关键因素—–缓存一致性(Cache Coherency)。这些CPU和GPU都有一些区别,深入底层才能写出更高效的代原创 2016-12-31 14:02:36 · 1496 阅读 · 0 评论 -
CUDA从组成到编程(二) Hello World!
首先是官网给的向量加法的例子。 我的环境是ubuntu16, cuda7.5 先是常用命令:这个的作用是使用自带的工具每0.5s刷新一下GPU的状态,可以作监控用$ watch -n 0.5 nvida-smi检查cuda编译器是否安装正确$ which nvcc检查GPU型号$ ls -l /dev/nv*编译与运行$ nvcc hello.cu -o hello$ ./hello#i原创 2016-12-31 18:53:06 · 827 阅读 · 0 评论 -
C++基数排序另一种实现
1.04497 1.65082Press ENTER or type command to continuePress ENTER or type command to continue 11.9672 16.6019Press ENTER or type command to continue ryan@Aeolian:~/VIM$ vim sort.cpp Press原创 2017-02-04 13:45:26 · 404 阅读 · 0 评论 -
基于C++11 CPU多线程的 奇偶排序(没有CUDA)
写的不一定对!错了求指正!前言这篇是用C++11 的 thread 做的。 编译大概是g++ sort -O3 -pthread -std=c++14 -o sort其实还没学c++14最近开始学CUDA,感觉线程具体怎么用和硬件是直接相关的, 不同架构啊不同精度啊使用线程的方式都应该不同。这篇博客就是个实验,用CPU实现一下奇偶排序为日后与CUDA做比较一直是CPU和GPU一起学的。二者都支持原创 2017-01-14 21:51:33 · 809 阅读 · 0 评论