layout | title | categories | tags | date | description | ||
---|---|---|---|---|---|---|---|
post
|
CUDA并行编程学习笔记
|
|
|
2022-08-31 12:39:39 -0700
|
CUDA并行编程指南
|
名词
- SIMD: 单指令多数据,是基于一个处理器核的,128位
- MMX:多媒体拓展
- AVX 高级适量拓展, 256位
计算机架构
冯诺依曼计算机架构
- 内存受限型
- QPI (quick path interconnect) 快速通道互联
连接机
采用4096个16核的CPU组装到一台机器上,也就是说64K个处理器来完成一个任务。连接机采用SIMD型并行处理,但是处理器之间的同步和通讯是很大的问题
Cell处理器(众核)
用一个常规处理器作为监管处理器(PowerPC),该处理器与大量高速流处理(SPE)相连。
- 每个流处理单元SPE调用执行一个程序
- 通过共享的网络,SPE之间和SPE与PowerPC之间进行相互通讯
多点计算
集群,当前最流行的莫过于Hadoop和spark了,一个是分布式文件系统,一个是分布式计算框架,这两个工具使得多点计算的方法充分发挥。
GPU架构
CUDA编程基础知识
学习CUDA C,可以在异构计算平台中实现高性能的应用。CUD的编译原则--基于虚拟指令集的运行时编译。
计算能力—高性能硬件与技术
GPU在高性能计算和深度学习加速中扮演着非常重要的角色,