计算引擎-GPU计算的优势

原创 2015年11月18日 15:03:58

基于GPU的大规模计算早有耳闻,直到中午吃饭范W聊到他的多层神经网络程算法在GPU和CPU上的运行效率是40:1的时候,我才恍然大悟。


中央处理CPU


用来解释机器指令以及处理计算数据。首先是控制部件取出机器指令,翻译并发出执行操作的控制信号;然后运算器负责执行定点浮点算数运算和位运算等;运算器执行操作用的数据和结果放在寄存器中;更多的计算数据放在高速缓存中通过总线和外部的内存交换数据。


图形处理器GPU


用来进行图像运算的处理器。回顾历史,GPU起源于将部分3D图像处理功能从CPU中分离出来进行硬件加速,最初将变换和光线处理TL从CPU中分离出来进行硬件加速;之后可编程的流处理器出现;然后顶点着色器和像素着色器Shader分离成为可编程单元;接着可编程管线出现发展出的单指令流多数据流SIMD,一条指令流同时处理多个数据流,举个栗子:二个m*n的矩阵相加,GPU用c个+指令,CPU用m*n个+指令;然后是现在的统一计算架构CUDA,GPU已经演变成为通用可编程高性能并行计算处理器辅以专用图像处理处理单元。


CPU和GPU对比


CUDA编程模型

一个CUDA程序是由一系列的GPU端的内核函数并行步骤和CPU端的串行处理步骤共同组成。运行在GPU上的并行计算函数称为内核函数Kernel。在CUDA中一个系统中存在一个CPU称作主机和多个个GPU称作设备。主机和设备各自拥有相互独立的存储地址空间,通过调用API存储器管理函数来操作显存。SDK提供二个级别的API,高级的运行时API和底层的驱动API。同时提供常用并行操作函数,基本矩阵与向量运算函数,快速傅立叶变换函数等丰富的函数库。


商业案例

Amazon与NVIDIA宣布推出基于亚马逊集群GPU计算实例

Google用NVIDIA GPU快速学习神经网络,但没有用于云平台方案

阿里云某高管分享阿里云将推出基于GPU的高性能计算,支持深度学习行业的创新


版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/afujin/article/details/49907349

Dns解析(下)

Dns解析(下)上篇讲述了Dns的查询包和发送,本文将分析Dns的返回包。下面这段程序是从Dns服务器上得到dns的返回包:ID_Packet=new DatagramPacket(new byte[...
  • craks
  • craks
  • 2002-03-19 09:15:00
  • 577

明晰class和struct之间的区别

class与struct c++最初被称为“c with class”,足见class在c++中的地位。在c++中我们可以用class自定义用户数据类型,然而它还存在一个类似的——struct,他们...
  • wangpengcsdn1
  • wangpengcsdn1
  • 2017-03-31 21:15:28
  • 5057

CPU和GPU计算的优缺点分析

CPU和GPU都是具有运算能力的芯片,CPU更像“通才”——指令运算(执行)为重+数值运算,GPU更像“专才”——图形类数值计算为核心。在不同类型的运算方面的速度也就决定了它们的能力——“擅长和不擅长...
  • charleslei
  • charleslei
  • 2016-12-10 12:45:23
  • 7150

移动GPU三种主流架构优缺点浅析

导读: GPU是Graphic Processor Unit的简称,顾名思义就是图形处理器。 GPU的概念最早是从图形工作站发展而来,从90年代的个人电脑普及开始,GPU迎来了其大发展的时代。 在90...
  • pizi0475
  • pizi0475
  • 2017-02-28 19:30:37
  • 2162

计算引擎-GPU计算的优势

基于GPU的大规模计算早有耳闻,直到中午吃饭范W聊到他的多层神经网络程算法在GPU和CPU上的运行效率是40:1的时候,我才恍然大悟。 中央处理CPU 用来解释机器...
  • afujin
  • afujin
  • 2015-11-18 15:03:58
  • 2125

人工智能到底用GPU还是FPGA?

人工智能人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的科学。...
  • PENGYAO_O
  • PENGYAO_O
  • 2017-08-15 16:03:56
  • 5973

GPU架构详解

PCI-E控制器,即PCI-EXPRESS LANES控制器,可以支持显示卡。PCI Express接口模式 通常用于显卡网卡等,主板类接口卡. 满足条件: 主板必须有PCI Express专用插槽...
  • Bruce_0712
  • Bruce_0712
  • 2017-06-28 00:01:18
  • 928

项目优化之:GPU编程

 1GPU编程,依赖于显卡 2GPU变成依赖于OpenGL和direct 3CPU的特点是:频率比较快,GPU的特点是寄存器非常非常的多。 4如果电脑是windows7,没...
  • toto1297488504
  • toto1297488504
  • 2014-08-31 22:20:10
  • 1520

深度学习简介,GPU计算的原理,分布式机器学习原理

深度学习简介深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习采用的模型...
  • horsefoot
  • horsefoot
  • 2017-05-04 20:48:58
  • 14474

gpu 概论

GPU通用计算调研报告 摘要:NVIDIA公司在1999年发布GeForce256时首先提出GPU(图形处理器)的概念,随后大量复杂的应用需求促使整个产业蓬勃发展至今。GPU在这十多年的演变...
  • prike
  • prike
  • 2016-02-26 14:18:24
  • 2125
收藏助手
不良信息举报
您举报文章:计算引擎-GPU计算的优势
举报原因:
原因补充:

(最多只允许输入30个字)