CUDA
飞翔2017
毕业于北京邮电大学硕士研究生,有超过13年流媒体技术研究和团队管理经验,先后就职于爱奇艺,大智慧股份直播事业部,曾经是波罗蜜创业合伙人之一。对视频直播行业的技术和商业模式都有深入研究,能快速搭建视频直播平台,多款用户数超亿的视频app创造者。能负责公司团队技术积累,流媒体技术研究,对VR, AR等最新流行技术也有深入研究。利用多种开源代码快速搭建视频直播系统。
展开
-
通用计算时代来临 论CUDA与OpenCL的异同
NVIDIA CUDA技术的到来,使GPU通用运算的应用领域得到了全面扩充,利用GPU强大的并行运算能力,使更加适合GPU进行运算的程序执行效率大幅提升。虽然早就有人提出了让并行计算架构的GPU,去处理非常适合他们的大规模并行计算工作,但是在CUDA问世前,所谓的GPGPU概念并没有真正的为我们解决问题,而早期专为图形运算而设计的GPU并不能通过一种通用性强的手段完成在GPU上的编程任务,专业性强原创 2012-08-23 16:38:05 · 2977 阅读 · 1 评论 -
再谈异构计算CPU+GPU(APU)
再谈异构计算CPU+GPU异构计算的英文名称是Heterogeneous computing,主要是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式。常见的计算单元类别包括CPU、GPU等协处理器、DSP、ASIC、FPGA等。我们常说的并行计算正是异构计算中的重要组成部分异构计算近年来得到更多关注,主要是因为通过提升CPU时钟频率和内核数量而提高计算能力的传统方式遇到了散热和能原创 2012-10-19 08:58:43 · 3310 阅读 · 1 评论 -
OpenCL和CUDA的使用比较
OpenCL和CUDA虽然不是同一个平级的东西,但是也可以横向比较!对OpenCL和CUDA的异同做比较: 指针遍历OpenCL不支持CUDA那样的指针遍历方式, 你只能用下标方式间接实现指针遍历. 例子代码如下:// CUDAstruct Node { Node* next; }n = n->next; // OpenCLstruct Node原创 2012-11-01 16:58:34 · 7944 阅读 · 0 评论 -
用OpenCL实现HEVC中ME模块的测试数据分析
使用opencl来实现编码算法中运动搜索模块!下面测试数据时在GTX570上的测试结果:LCU为32x32, 100帧720P, CPU上纯C算法使用搜索时间是67s, GPU上是0.915sLCU为16x16, CPU 是76.8s, GPU上是1.6sLCU为8x8, CPU 是82.5s, GPU上是4.2s 同样的程序, CPU改为SSE实现, G原创 2013-06-05 19:07:43 · 4706 阅读 · 3 评论 -
OpenCL的一个简单例子!
1 Hello OpenCL 这里编写一个最简单的示例程序,演示OpenCl的基本使用方法: 1.首先可以从Nvdia或者Amd或者Intel或者所有OpenCl成员的开发者网站上下载一份他们实现的OpenCL的SDK。虽然不同公司支持了不同版本的OpenCL和扩展ext,但是在相同版本上对于标准的OpenCL接口,每个SDK实现的结果都是一样的,如果你只是用标准的OpenC原创 2013-06-08 09:40:45 · 7673 阅读 · 3 评论