![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
CUDA
Sylvia_zsh
这个作者很懒,什么都没留下…
展开
-
NVIDIA CUDA初级教程视频 - 学习笔记(一)CPU体系架构概述
一句话:CPU大量用于数据搬运而非数值运算,用流水线和分支提高效率周斌老师:NVIDIA CUDA初级教程视频第2集【计算机组成原理】Q:什么是CPU?A:是执行指令、处理数据的器件,用于完成基本的逻辑和算术指令,现在增加了复杂功能(内存接口、外部设备接口),包含大量晶体管(上百亿)Q:什么是指令?A:包括算术、访存、控制。对于一个编译好的程序,最优化目标:CPI(每条指令所需...原创 2018-12-07 15:06:53 · 684 阅读 · 0 评论 -
NVIDIA CUDA初级教程视频 - 学习笔记(四)GPU体系架构概述
第5集名词解释 FLOPS – FLoating-point OPerations per Second GFLOPS - One billion (109) FLOPS TFLOPS – 1,000 GFLOPS思路1:精简、减肥(拿掉CPU中繁杂的管理人员)n个核同时执行n个程序片元指令流共享,多个程序片元共享指令流(不共享的话就需要复杂控制机构,又有额外开销)...原创 2019-01-17 10:32:31 · 331 阅读 · 0 评论 -
NVIDIA CUDA初级教程视频 - 学习笔记(五)CUDA/GPU 编程模型
CPU-GPU交互:各自的物理内存空间通过PCIE总线互连(8GB/s~16GB/s)交互开销较大线程组织架构说明 一个Kernel具有大量线程 线程被划分成线程块‘blocks’ 一个block内部的线程共享 ‘Shared Memory’ 可以同步 ‘_syncthreads()’ Kernel启动一个‘grid’,包含若干线程块 用户设定 线程和线程...原创 2019-01-17 11:16:37 · 540 阅读 · 0 评论 -
NVIDIA CUDA初级教程视频 - 学习笔记(二)并行程序设计概述
一句话:并行计算是同时应用多个计算资源解决一个计算问题 并行处理:搬砖模型串行计算模式:常规软件是串行的,设计运行于一个中央处理器上 (CPU),通过离散的指令序列完成一个问题的解决,一条一条指令的执行,同时只有一条指令在执行并行计算模式:并行计算是同时应用多个计算资源解决一个计算问题,涉及多个计算资源或处理器,问题被分解为多个离散的部分,可以同时处理(并行),每个部分可...原创 2019-01-16 19:01:59 · 247 阅读 · 0 评论