CUDA
文章平均质量分 92
Dodo·D·Caster
这个作者很懒,什么都没留下…
展开
-
CUDA学习3-优化部分
网课链接:https://www.bilibili.com/video/BV1kx411m7Fk?p=11 知识回顾 基本概念 Thread 每个线程私有 Local Memory Block 每个线程块有 Shared Memory Device 每个设备(多个kernel)共有 Global Memory 内存 local memory 每个科室的员工的办公桌 只供员工个人使用 shared memory 每个科室的打印机 只供科室内部使用 global memory 公.原创 2021-02-17 12:32:23 · 385 阅读 · 0 评论 -
CUDA学习2-编程部分
CUDA编程 函数声明 host:主机端,通常指CPU device:设备端,通常指GPU(数据可并行) kernel:数据并行处理函数,在主机端调用kernel可以在设备端创建大量轻量级线程 host 和 device拥有各自的存储器 CUDA编程包括主机端和设备端两部分代码 执行位置 调用位置 _device_float DeviceFunc() device device _global_void KernelFunc() device host _host_float原创 2021-01-13 21:53:25 · 301 阅读 · 0 评论 -
CUDA学习1-理论部分
这里只是简单介绍一下,具体可查看计算机组成这一专栏: https://blog.csdn.net/qq_45347768/category_10624996.html CUDA学习1-CPU体系架构概述 CPU 取值-译指-执行-访存-写回 流水线(Pipelines) 举个例子,比如说洗衣服,你可以准备三个盆子,一个先泡着,一个在放水,一个在洗,这样就实现了并行的操作。 优点 极大的减小时钟周期 缺点 增加一些延迟和芯片面积 分支预测(Branch prediction) 旁路 其实就是开一.原创 2021-01-09 17:12:34 · 203 阅读 · 0 评论