自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

异构开发技术社区官方博客

关注异构计算的技术发展与创新,分享异构开发工具及技巧,提供最新的资讯和开发资料,为开发者营造一个轻松、高效的异构开发学习交流平台。

  • 博客(2)
  • 资源 (14)
  • 收藏
  • 关注

翻译 通过 Autostereograms 案例学习 OpenGL 和 OpenCL 的互操作性

在过去的十年里, GPU (图形处理单元)已经从特殊硬件(特供)转变成可以在数值计算领域开辟新篇章的高性能计算机设备。 许多算法可以使用拥有巨大的处理能力的GPU来高速执行和处理大数据量。即使在通常的情况下,不可能将图形硬件编程化, 图形硬件也可以加快算法与图像的处理。 举个例子:通常情况下可以用来计算图形差分,模糊图像, 合并图像,甚至是进行图像(或数组)平均值计算。

2014-06-29 09:09:05 2808

翻译 游戏开发人员使用CodeXL:如何为GCN分析HLSL

AMD Radeon™ R7、R9系列,几乎所有的HD 7000系列显卡,包括史上最快显卡AMD Radeon™ R9 295X2与流行的AMD Radeon™ R9 290X显卡均采用了下一代图形架构GCN。下一代游戏主机也将采用GCN,对游戏开发人员而言,首要任务是为此架构优化着色器。 以前,游戏开发人员可以使用GPU ShaderAnalyzer(GSA),分析DirectX® HLSL着色器性能。但目前GSA不支持GCN。最近发布的CodeXL 1.4通过CodeXL的命令行工具提供了此项功能。具体

2014-06-09 14:57:11 4019

Erik Noreke:明日的技术与教育工具

Khronos Group商务副主席Erik Noreke在主题为《明日的技术与教育工具》的演讲中,重点介绍了OpenCL生态系统及OpenCL 2.0(预测版)新特点。他指出OpenCL 2.0预测版大大加强了内存和执行模型,以应对新兴的硬件性能并为开发者提供更高的灵活度、功能和性能。

2014-05-29

HSA(异构计算架构)介绍

来自AMD的资深工程师陆璐讲解了异构系统的体系结构(HSA)诞生的历史以及现在的软件生态系统。视频请见:http://v.csdn.hudong.com/s/article.html?arcid=15816958

2014-05-29

OpenCL编程与优化Part I

来自AMD的资深工程师谢海波从GPU的体系结构、线程与调度、内存层次结构、以及指令吞吐等方面讲解了GPU编程优化的一般技巧。

2014-05-29

OpenCL编程与优化Part II

来自AMD的资深工程师谢海波从CPU/GPU的数据传输、OpenCL的运行时开销、APU架构等方面讲解了HSA和OpenCL优化。

2014-05-29

GPU上数字图像处理并行算法实现

旨在介绍数字图像处理的入门级并行算法,引导编程爱好者们在GPU或者APU上实现图像处理算法的并行程序,主要内容包括实现并行算法的主要步骤和性能的调整及优化,并以图像滤波和插值做为典型例子。

2014-05-29

CPU&GPU的并行编程比较

从软件编码,硬件实现,操作系统支持的角度介绍 OpenCL+GPU 并行编程和 CPU多线程并行编程的不同点, 以加深听众对 OpenCL+GPU 并行编程的理解。

2014-05-29

稀疏矩阵LU分解在GPU上的性能优化

稀疏线性方程组求解Ax=b是很多科学计算与工程应用的核心问题,例如天气预报、流体力学仿真、经济模型模拟、集成电路仿真、电气网络仿真、网络分析、有限元方法等。本报告以集成电路仿真中的极稀疏矩阵LU分解为例,讲述稀疏LU分解在GPU上的并行方法、以及性能优化方法。

2014-05-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除