自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

异构开发技术社区官方博客

关注异构计算的技术发展与创新,分享异构开发工具及技巧,提供最新的资讯和开发资料,为开发者营造一个轻松、高效的异构开发学习交流平台。

  • 博客(3)
  • 资源 (14)
  • 收藏
  • 关注

翻译 OpenCL 2.0 :设备队列和工作组内建函数

在上一篇文章中,我们探讨了OpenCL™2.0管道(pipes)。而本文将讲述另一个重要的特性:设备队列(device enqueue)。同时会讲述新的内建工作组函数。 要想最大程度地掌握本文内容,我们建议做好下面的准备工作:l  参考注释,通读每篇博文的代码片。l  请点击这里下载AMD OpenCL2.0驱动,下载页中列出了已支持平台的清单。l  请点击这里下载范例代码

2014-12-02 09:43:11 7023 5

翻译 OpenCL 2.0 规范 – Pipes(管道)

上一篇文章我们介绍了OpenCL2.0的新特性共享虚拟内存(SVM)。本文将继续讲述另一个新特性,“pipes(管道)”。

2014-12-02 09:41:41 4487

翻译 OpenCL 2.0 规范 – SVM共享虚拟内存

OpenCL2.0规范相对于1.2版本做出了重大改进,使得一个多元系统中各个硬件之间增强了通信与协作能力。在接下来的系列文章中,将着重讲解OpenCL2.0的新特性,探究其重要性以及对开发、性能等方面会产生什么影响。

2014-12-02 09:40:55 8700 1

Erik Noreke:明日的技术与教育工具

Khronos Group商务副主席Erik Noreke在主题为《明日的技术与教育工具》的演讲中,重点介绍了OpenCL生态系统及OpenCL 2.0(预测版)新特点。他指出OpenCL 2.0预测版大大加强了内存和执行模型,以应对新兴的硬件性能并为开发者提供更高的灵活度、功能和性能。

2014-05-29

HSA(异构计算架构)介绍

来自AMD的资深工程师陆璐讲解了异构系统的体系结构(HSA)诞生的历史以及现在的软件生态系统。视频请见:http://v.csdn.hudong.com/s/article.html?arcid=15816958

2014-05-29

OpenCL编程与优化Part I

来自AMD的资深工程师谢海波从GPU的体系结构、线程与调度、内存层次结构、以及指令吞吐等方面讲解了GPU编程优化的一般技巧。

2014-05-29

OpenCL编程与优化Part II

来自AMD的资深工程师谢海波从CPU/GPU的数据传输、OpenCL的运行时开销、APU架构等方面讲解了HSA和OpenCL优化。

2014-05-29

GPU上数字图像处理并行算法实现

旨在介绍数字图像处理的入门级并行算法,引导编程爱好者们在GPU或者APU上实现图像处理算法的并行程序,主要内容包括实现并行算法的主要步骤和性能的调整及优化,并以图像滤波和插值做为典型例子。

2014-05-29

CPU&GPU的并行编程比较

从软件编码,硬件实现,操作系统支持的角度介绍 OpenCL+GPU 并行编程和 CPU多线程并行编程的不同点, 以加深听众对 OpenCL+GPU 并行编程的理解。

2014-05-29

稀疏矩阵LU分解在GPU上的性能优化

稀疏线性方程组求解Ax=b是很多科学计算与工程应用的核心问题,例如天气预报、流体力学仿真、经济模型模拟、集成电路仿真、电气网络仿真、网络分析、有限元方法等。本报告以集成电路仿真中的极稀疏矩阵LU分解为例,讲述稀疏LU分解在GPU上的并行方法、以及性能优化方法。

2014-05-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除