- 博客(5)
- 收藏
- 关注
翻译 OpenCL profiling and debugging - OpenCL 分析与调试
Introduciton使用OpenCL编写程序不应该局限于编写独立的高性能的内核,而是应该专注于应用程序的并行。之前本书介绍了如何根据设备的特征优化在设备上运行的内核。本章介绍了我们将介绍设备上进行计算的内核与主机之间的交互。我们需要对性能进行衡量,在整个应用程序中找到瓶颈。一个OpenCL应用程序包括若干个内核以及主机和设备之间的IO。回答下列的一些问题,能够帮助我们提高应用程序的性能
2012-12-20 13:31:19 3977 2
翻译 OpenGL API - glBufferData
NameglBufferData — creates and initializes a buffer object's data store创建并初始化一个缓冲区对象的存储Specificationvoid glBufferData(GLenum target, GLsizeiptr size, const
2012-12-12 09:21:36 3241
翻译 OpenGL API - glBindBuffer
NameglBindBuffer — bind a named buffer object绑定一个缓冲区对象C Specificationvoid glBindBuffer(GLenum target, GLuint buffer);ParameterstargetSpecifies
2012-12-11 21:47:51 1940
翻译 OpenGL API - glGenBuffers
NameglGenBuffers — generate buffer object names产生缓冲区对象名C Specificationvoid glGenBuffers(GLsizei n, GLuint * buffers);ParametersnSpecifies the
2012-12-11 21:40:17 2244
翻译 OpenCL 学习笔记 - OpenCL C built-in functions - OpenCL C的内建函数
work-item funciton - 工作项函数应用程序使用函数clEnqueueNDRangeKernel和clEnqueueTask将OpenCL中的数据并行和任务并行kernel入队。使用clEnqueueNDRangeKernel将数据并行的kernel入队并执行,应用程序指明全局的工作量(global work size,即并行执行这个kernel的工作项(work item)的
2012-12-11 21:20:30 6371
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人