博客专栏  >  编程语言   >  高性能计算——GPU篇

高性能计算——GPU篇

本专栏面向 GPU 程序开发者,更确切地说是基于 CUDA 的 NVIDIA GPU 开发者,由浅入深介绍 GPU 硬件架构、软件开发流程、性能优化技巧、实际案例。

关注
54 已关注
13篇博文
  • 【经典回顾】Nvidia GPU 上的 CNN 计算速度变迁

    笔者从 2012 年初开始接触 GPU 编程,2014 年上半年开始接触 Caffe,可以毫不谦虚地说是“一天天看着 Nvidia GPU 和 Caffe 长大的”。Nvidia GPU 架构经历了 ...

    2017-03-11 23:16
    4224
  • Pascal GPU 架构详解

    1. 前言Nvidia 在今年的 GTC( GPU Technology Conference ) 上高调宣布了 Pascal 架构——专门针对每瓦性能优化的新架构,采用 16nm 工艺。接着发布了该...

    2016-12-25 17:44
    6759
  • CUDA从入门到精通(十):性能剖析和Visual Profiler

    入门后的进一步学习的内容,就是如何优化自己的代码。我们前面的例子没有考虑任何性能方面优化,是为了更好地学习基本知识点,而不是其他细节问题。从本节开始,我们要从性能出发考虑问题,不断优化代码,使执行速度...

    2013-07-26 09:00
    12263
  • CUDA从入门到精通(九):线程通信实例

    接着上一节,我们利用刚学到的共享内存和线程同步技术,来做一个简单的例子。先看下效果吧:   很简单,就是分别求出1~5这5个数字的和,平方和,连乘积。相信学过C语言的童鞋都能用for循环做出同...

    2013-07-25 21:12
    4575
  • CUDA从入门到精通(八):线程通信

    我们前面几节主要介绍了三种利用GPU实现并行处理的方式:线程并行,块并行和流并行。在这些方法中,我们一再强调,各个线程所进行的处理是互不相关的,即两个线程不回产生交集,每个线程都只关注自己的一亩三分地...

    2013-07-25 20:03
    4223
  • CUDA从入门到精通(七):流并行

    前面我们没有讲程序的结构,我想有些童鞋可能迫不及待想知道CUDA程序到底是怎么一个执行过程。好的,这一节在介绍流之前,先把CUDA程序结构简要说一下。 CUDA程序文件后缀为.cu,有些编译器可能不...

    2013-07-24 14:05
    6361
  • CUDA从入门到精通(六):块并行

    同一版本的代码用了这么多次,有点过意不去,于是这次我要做较大的改动,大家要擦亮眼睛,拭目以待。   块并行相当于操作系统中多进程的情况,上节说到,CUDA有线程组(线程块)的概念,将一组线程组织到...

    2013-07-23 22:08
    4690
  • CUDA从入门到精通(五):线程并行

    多线程我们应该都不陌生,在操作系统中,进程是资源分配的基本单元,而线程是CPU时间调度的基本单元(这里假设只有1个CPU)。 将线程的概念引申到CUDA程序设计中,我们可以认为线程就是执行CUDA程...

    2013-07-23 21:46
    5291
  • CUDA从入门到精通(四):加深对设备的认识

    前面三节已经对CUDA做了一个简单的介绍,这一节开始真正进入编程环节。 首先,初学者应该对自己使用的设备有较为扎实的理解和掌握,这样对后面学习并行程序优化很有帮助,了解硬件详细参数可以通过上节介绍的几...

    2013-07-23 13:17
    6890
  • CUDA从入门到精通(三):必备资料

    刚入门CUDA,跑过几个官方提供的例程,看了看人家的代码,觉得并不难,但自己动手写代码时,总是不知道要先干什么,后干什么,也不知道从哪个知识点学起。这时就需要有一本能提供指导的书籍或者教程,一步步跟着...

    2013-07-23 09:20
    6151
  • CUDA从入门到精通(二):第一个CUDA程序

    书接上回,我们既然直接运行例程成功了,接下来就是了解如何实现例程中的每个环节。当然,我们先从简单的做起,一般编程语言都会找个helloworld例子,而我们的显卡是不会说话的,只能做一些简单的加减乘除...

    2013-07-22 22:50
    9015
  • CUDA从入门到精通(一):环境搭建

    NVIDIA于2006年推出CUDA(Compute Unified Devices Architecture),可以利用其推出的GPU进行通用计算,将并行计算从大型集群扩展到了普通显卡,使得用户只需...

    2013-07-22 21:54
    17102
  • CUDA从入门到精通(零):写在前面

    在老板的要求下,本博主从2012年上高性能计算课程开始接触CUDA编程,随后将该技术应用到了实际项目中,使处理程序加速超过1K,可见基于图形显示器的并行计算对于追求速度的应用来说无疑是一个理想的选择。...

    2013-07-22 21:33
    12301

img博客搬家
img撰写博客
img专家申请
img意见反馈
img返回顶部