- 博客(10)
- 资源 (56)
- 收藏
- 关注
转载 编译 链接和加载
1. 序 最近在折腾各种.so,碰到了一些问题,一开始对于很多错误也没有头绪,茫然不知所措。索性化了一天多时间将>中部分内容略读了一遍,主要是关于编译,链接和加载这块的。于是顺便做个笔记,方便以后回顾。基本上知道了这些,对于编译,链接和加载过程中产生的各种问题,应该就能从根本上理解并解决了。其实以前上学时也看过那本经典的>,当时还写了篇>,不过此次会更细致深入地了解下整个编译链
2016-08-31 21:24:37 2096
转载 GPGPU OpenCL使用结构体数据
OpenCL编程中可以使用结构体,只需要在核函数kernel中提供同样的结构体申明就可以啦。 如果在主函数中定义了结构体:1 typedef struct studentNode{2 int age;3 float height;4 }student; 主函数中定义数据,并传输给OpenCL kernel: 1 student
2016-08-21 22:29:10 1224
转载 GPGPU OpenCL/CUDA 高性能编程的10大注意事项
1.展开循环 如果提前知道了循环的次数,可以进行循环展开,这样省去了循环条件的比较次数。但是同时也不能使得kernel代码太大。 循环展开代码例子: View Code2.避免处理非标准化数字 OpenCL中非标准化数字,是指数值小于最小能表示的正常值。由于计算机的位数有限,表示数据的范围和精度都不可能是无限的。(具体可以查看IEEE 754标准,
2016-08-21 22:23:49 1829
原创 OpenCL中设置内核参数整理
资源摘自OpenCL实战. 首先,说一下kernel中的几种地址空间限定符:(1)__global该参数的数据会保存在全局数据空间,在内核中的参数使用例子如下:__kernel void kernel_func(__global float *f){}(2)__constant该参数的数据会保存在全局,只读内存中,该参数使用前必
2016-08-21 22:14:31 3972
原创 OpenCL2.0特性之SVM
在OpenCL2.0中,增加了SVM(shared virtual memory)的特性。在开始讲解SVM之前,我们先用图片来看下OpenCL1.2中主机与设备端的地址空间: 图1 OpenCL1.2中主机与设备端地址空间 从图1可以看到,主机与设备具有不同的地
2016-08-16 10:42:53 1650
转载 clCreateBuffer参数说明
clCreateBuffer第二个参数可以有多种,详情请点击此次,对于前三个比较简单,在此就忽略。1、CL_MEM_USE_HOST_PTR 对于CL_MEM_USE_HOST_PTR,刚开始buffer object的值是来自于host_ptr,但buffer object处理之后,host_ptr中的值如何变化,这点在OpenCL中没有定义。那就看看A卡对次是如何处理,一
2016-08-16 10:26:27 1501
转载 从零开始学习OpenCL开发(四)shader
这里介绍关于OpenCL中program函数的写法,program函数通常是文本形式的,然后使用clCreateProgramWithSource这样的接口load进来。在Shader编程中也经常使用这种形式书写GPU上运行的代码,所以为了表述清楚和理解方便,这里姑且把这些program函数的源码文本称为OpenCL的shader吧 下面都是写在shader中的一些语法 1
2016-08-04 22:46:43 1047
转载 从零开始学习OpenCL开发(三)深入API
这里将更深入的说明一些OpenCL API的功能1. 创建buffer涉及到内存与显存的操作总是复杂麻烦的,这个函数也一样。。。cl_memclCreateBuffer (cl_context context, cl_mem_flags flags, size_t size, void *host_pt
2016-08-04 22:45:55 1172
转载 从零开始学习OpenCL开发(二)一个最简单的示例与简单性能分析
1 Hello OpenCL 这里编写一个最简单的示例程序,演示OpenCl的基本使用方法: 1.首先可以从Nvdia或者Amd或者Intel或者所有OpenCl成员的开发者网站上下载一份他们实现的OpenCL的SDK。虽然不同公司支持了不同版本的OpenCL和扩展ext,但是在相同版本上对于标准的OpenCL接口,每个SDK实现的结果都是一样的,如果你只是用标准的O
2016-08-04 22:45:12 1508
转载 从零开始做OpenCL开发》系列文章的第一篇。
本文将作为我《从零开始做OpenCL开发》系列文章的第一篇。 1 异构计算、GPGPU与OpenCL OpenCL是当前一个通用的由很多公司和组织共同发起的多CPU\GPU\其他芯片 异构计算(heterogeneous)的标准,它是跨平台的。旨在充分利用GPU强大的并行计算能力以及与CPU的协同工作,更高效的利用硬件高效的完成大规模的(尤其是并行度高的)计算。在过去利用
2016-08-04 22:44:38 2578
Android核心分析
2011-12-25
佛山网通EPON的FTTH工程方案设计
2011-12-25
ARM---Cortex-A8处理器
2022-09-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人