cuda
文章平均质量分 78
天山
精通C/C++/Fortran、MPI、OpenMP、CUDA等编程语言
精通大规模并行计算软件开发
精通GPU、MIC异构并行编程技术,熟悉并行计算编程模型
熟悉SSE、AVX等硬件加速指令集
熟悉Intel vTune、MPI Trace、Profiler等分析工具
展开
-
CPU+GPU集群计算中的一种动态负载均衡设计方法
目前,随着高性能计算应用软件的发展,应用对计算性能的需求越来越高,越来越多的高性能计算应用软件采用的是CPU与GPU异构协同计算的计算模式,即在传统的多核CPU架构基础上扩展GPU架构处理器,组成CPU和GPU混合的架构平台,基于该架构平台设计相应的软件解决方案,使得CPU与GPU能够有效的进行协同计算。其中,CPU与GPU的负载均衡问题是关系到CPU与GPU混合架构平台的计算性能能否发挥到极致的重要因素。原创 2015-10-14 13:23:59 · 4024 阅读 · 1 评论 -
利用高性能计算加速深度学习算法
深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。深度学习典型应用为图像识别和语音识别。GPU正在以大大超过摩尔定律的速度高速发展(大约每隔半年 GPU 的性能增加一倍),远远超过了CPU 的发展速度。GPU加速深度学习算法可以获得较大的性能提升,本文主要介绍深度学习算法在GPU平台上的并行设计和优化方法。原创 2015-10-28 14:17:57 · 13105 阅读 · 1 评论 -
NVIDIA CUDA系列视频教程
NVIDIA CUDA开发者系列培训转载 2015-09-18 14:42:33 · 6572 阅读 · 0 评论 -
矩阵按行(列)求和CUDA并行算法设计
通过矩阵按行求和与按列求和两个示例介绍CUDA并行算法设计的思路,希望对大家有所帮助。很多公司招聘CUDA工程师面试时也会考察这个题目。原创 2013-10-25 09:07:39 · 6387 阅读 · 2 评论 -
阿里云CTO章文嵩:GPU高性能计算是下一个风口
7月22日首届阿里云分享日×云栖大会北京峰会召开,吸引了海内外2000余名开发者、创业者及生态伙伴参与。阿里云CTO章文嵩在分享日指出,随着DT时代的到临,高性能数据分析需求开始显现,云上将形成包括高性能计算在内的技术生态。章文嵩透露,阿里巴巴内部早期上线了33个GPU线上应用,进行着1亿+张级别的图片训练,同时配备了2P FLOPS的GPU计算集群,结果在一周之内就被几乎全部占用转载 2015-09-11 14:03:26 · 1450 阅读 · 0 评论 -
GPU高性能计算与图像处理
CUDA编程语言的推出,使得在GPU平台上的高性能计算应用软件越来越多。目前,CUDA在石油勘测、流体动力学模拟、天文计算、分子动力学仿真、生物计算、图像处理、音频视频编解码、医疗成像、金融、数据库等领域得到广泛的应用,在很多应用中获得2-3个数量级的加速比,极大地提高了性能。原创 2013-08-14 11:22:47 · 15078 阅读 · 1 评论 -
GPU与MIC对比
属性NVIDIA GPUIntel MIC单核流处理器/CUDA core每个核运行一个线程X86 core每个核上最多支持4个硬件线程主频接近1GHz1.0-1.1GHz核数数十个到数千个57-61并行度原创 2014-09-29 21:02:54 · 7963 阅读 · 0 评论 -
快速开发CUDA程序的方法
根据几年的CUDA开发经验,简单的介绍下CUDA程序的大概开发步骤,按照先修改CPU串行程序后移植到GPU平台的原理,把需要在GPU上做的工作尽量先在CPU平台上修改,降低了程序的开发难度,同时有利用bug的调试。通过实现一种快速、有效地CUDA并行程序开发的方法,提高CUDA并行程序开发效率,降低CUDA并行程序开发周期和难度。(1) CPU串行程序分析对于CPU串行程序,首先需要原创 2014-09-22 18:19:52 · 3898 阅读 · 1 评论 -
浅谈多节点CPU+GPU协同计算负载均衡性设计
近年来,基于CPU+GPU的混合异构计算系统开始逐渐成为国内外高性能计算领域的热点研究方向。在实际应用中,许多基于 CPU+GPU 的混合异构计算机系统表现出了良好的性能。但是,由于各种历史和现实原因的制约,异构计算仍然面临着诸多方面的问题,其中最突出的问题是程序开发困难,尤其是扩展到集群规模级别时这个问题更为突出。主要表现在扩展性、负载均衡、自适应性、通信、内存等方面。一、 CPU+G原创 2012-11-26 09:01:37 · 15134 阅读 · 3 评论 -
CUDA Toolkit 4.1 RC1 新增LLVM编译器
2011年11月10日,据NVIDIA官方宣布CUDA Toolkit 4.1 RC1版本发布,目前CUDA注册开发者已经可以下载。CUDA开发者请登录官网下载或者立即注册下载。发布者期待通过注册开发者的反馈了解使用新版本中的个人体会(优点与缺点)。▲CUDA Toolkit 4.1 RC1版本发布 新版本包括一款新的基于LLVM的CUDA编译器,超过一千项新的图像处理功能,转载 2011-12-22 09:59:58 · 1077 阅读 · 0 评论 -
Win7 VS 2010+CUDA 4.0配置
一、安装VisualStudio 2010二、安装CUDA4.01. 依次安装64位DeveloperDrivers for WinVista and Win7 (270.81),CUDAToolkit 4.0,GPUComputing SDK 4.02. 工具库生成:现在VS可以打开Cuda SDK的例子试试了,不过在这之前有两个工具库最好先生成一下转载 2011-12-22 10:10:32 · 2735 阅读 · 2 评论 -
高性能计算知识汇总
高性能计算各方面知识汇总:高性能计算中用到的测试程序、存储系统、网络系统、集群管理系统、并行开发环境、并行开发策略、容错等转载 2016-01-26 12:54:30 · 1903 阅读 · 0 评论