- 博客(7)
- 资源 (2)
- 收藏
- 关注
转载 130 个相见恨晚的超实用网站
130 余个相见恨晚的超实用网站 文末没有公众号,只求 点赞 + 关注文章目录 130 余个相见恨晚的超实用网站 搞学习 找书籍 冷知识 / 黑科技 写代码 资源搜索 小工具 导航页(工具集) 看视频 学设计 搞文档...
2020-03-18 21:22:13 175358
转载 CUDA编程入门
版权声明:本文为CSDN博主「zyazky」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.csdn.net/zyazky/article/details/52456503首先看一下CPU和GPU的微架构和计算能力对比。例如我的笔记本lenovo Y480,4核CPU,NVIDIA GT650M显卡384...
2019-11-06 09:30:06 437
转载 CUDA之Thread、Wrap执行详解
从硬件角度分析,支持CUDA的NVIDIA 显卡,都是由多个multiprocessors 组成。每个 multiprocessor 里包含了8个stream processors,其组成是四个四个一组,也就是两组4D的处理器。每个 multiprocessor 还具有 很多个(比如8192个)寄存器,一定的(比如16KB) share memory,以及 texture cache 和 cons...
2019-11-01 10:08:18 893
转载 CUDA软件架构—网格(Grid)、线程块(Block)和线程(Thread)的组织关系以及线程索引的计算公式
本文链接:https://blog.csdn.net/dcrmg/article/details/54867507网格(Grid)、线程块(Block)和线程(Thread)的组织关系CUDA的软件架构由网格(Grid)、线程块(Block)和线程(Thread)组成,相当于把GPU上的计算单元分为若干(2~3)个网格,每个网格内包含若干(65535)个线程块,每个线程块包含若干(512)个...
2019-11-01 09:26:05 448
转载 CUDA编程——GPU架构,由sp,sm,thread,block,grid,warp说起
掌握部分硬件知识,有助于程序员编写更好的CUDA程序,提升CUDA程序性能,本文目的是理清sp,sm,thread,block,grid,warp之间的关系。由于作者能力有限,难免有疏漏,恳请读者批评指正。 首先我们要明确:SP(streaming Process),SM(streaming multiprocessor)是硬件(GPU hardware)概念。而thread,block,g...
2019-11-01 09:05:33 969
转载 学习BLAS库 -- GEMM
本文链接:https://blog.csdn.net/cocoonyang/article/details/58602654函数语法:SGEMM( TRANSA,TRANSB,M,N,K,ALPHA,A, LDA, B, LDB, BETA, C, LDC)功能:matrix matrix multiply (row major order)| ...
2019-10-24 10:09:44 609
转载 Windows下lapack的编译
ack我就不介绍了,MATLAB的底层就是它。我要在Windows下使用lapack,应该怎么办?1. 有现成的编译好的库。比如LAPACK for Windows,或者http://www.fi.muni.cz/~xsvobod2/misc/lapack/;2.CLAPACK,即将原始Fortran程序经f2c转换后的C程序。可以自己编译,也可以使用已经编译好的library...
2019-10-24 10:03:32 1389
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人