自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

万类霜天竞自由

数风流人物,还看今朝!内容很干燥

  • 博客(9)
  • 资源 (2)
  • 收藏
  • 关注

原创 OpenCL 入门级优化

优化问题,需要具体问题具体分析,基本原则以下三点:1.获取设备信息 device info://获取硬件设备中物理层有几个计算单元cl_ulong maxComputeUnits = device .getInfo<CL_DEVICE_MAX_COMPUTE_UNITS>();//获取work group 最大 size 这个等价于一个compute unit 能并发处理的最大线程数cl_ulong maxWorkGroupSize = device.getInfo<C

2021-01-13 16:55:12 528

原创 OpenCL Reduction操作

Reduction操作:说白了就是把一个或多个数组输入,最后输出一个结果。参考这个博客:https://www.cnblogs.com/xudong-bupt/p/3586518.html我这边实现了一下求一个数组里的最大值:host端:#include "openclcommon/oclManager.h"#include<stdlib.h>#include <iostream>#define ArraySize 512int main(){

2021-01-13 16:54:11 540

原创 OpenCL中kernel设置的序号关系

发起kernel运算的API:cl_int enqueueNDRangeKernel(const Kernel& kernel,const NDRange& offset,const NDRange& global,const NDRange& local = NullRange,const VECTOR_CLASS<Event>* events = NULL,Event* event = NULL)我们会设置数据数组的核心参数:

2021-01-11 16:22:03 1982

原创 OpenCL 调试 方法

使用 cl::event 对象 获取四个时间值,通常用来调试优化时,某一次kernel的运行时间调优,要的就是速度//开始执行该命令的时间cl_ulong start = oneEvent.getProfilingInfo<CL_PROFILING_COMMAND_START>();//结束执行该命令的时间cl_ulong end = oneEvent.getProfilingInfo<CL_PROFILING_COMMAND_END>();//设置队列的时间

2021-01-08 15:39:42 792

原创 上一篇示例API详解

1.初始化API环境部分:1.1获得系统中所有opencl平台cl_int err;std::vector< cl::Platform > platformList;err = cl::Platform::get(&platformList);//判断是否有错误,err的正确返回值是CL_SUCCESSif (!checkErr(err,"Platform::get"))return false;std::cerr << "Platform number

2020-12-28 10:02:59 128

原创 自定义一个简单OpenCL C++ 类

新建一个类,用来管理opencl整个流程,设定为单例模式,直接上主要代码:.h 文件#ifndef CLMANAGER_H_#define CLMANAGER_H_#include <CL/cl.hpp>#include <cstdio>#include <cstdlib>#include <fstream>#include <iostream>#include <string>#include <i

2020-12-25 16:28:56 447

原创 OpenCL简单环境配置VS C++版本

基于VS2013以后的版本,配置C++的OpenCL环境0.提前准备新建一个空的win32控制台项目。1.第一步想办法搞到OpenCL SDK的文件。Intel,AMD,Nvidia都有,网上一搜就知道怎么找。我这边下载安装了Nvidia的专属Cuda,所以在以下路径可以找到:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.2include下的CL头文件夹lib\x64\opencl.lib把以上两部分复制到空项

2020-12-25 15:28:40 735

原创 GPU并行计算基础知识科普

1.什么是异构架构?说白了就是CPU内部组织 和 GPU内部组织不一样,即“异构”。2.什么叫GPU通用计算,也就是并行计算。以前的计算任务通常是由cpu来完成的。后来随着GPU的性能越来越强,就和CPU组织在一起完成某项计算任务。并行计算,顾名思义就是同时进行计算。看下面的GPU架构就大概知道了:每个小格子可以做同样的计算任务,非常适合处理那种没有先后顺序影响的计算任务。举个例子,要找到一个512长度的正整数uint数组里最大的值?用CPU做搞个for循环也不是不行

2020-12-17 21:15:21 4604

原创 通过Unity实现手机本地模型(obj)的读取

Android插件的制作:1.Unity的Android插件的制作 参考http://stephen830.iteye.com/blog/2088504;2.把弹出文件目录选择加入android插件 文件夹目录参考http://blog.csdn.net/wanglong0537/article/details/6368088;3.最后把返回文件绝对路径加入android插件 参考ht

2015-11-13 15:17:55 2239

Mimics临床应用小红书PDF

mimics临床应用Mimics软件临床应用++计算机辅助外科入门技术、、mimics临床应用Mimics软件临床应用++计算机辅助外科入门技术mimics临床应用Mimics软件临床应用++计算机辅助外科入门技术mimics临床应用Mimics软件临床应用++计算机辅助外科入门技术

2018-01-11

UNITY3D官方案例Roll_A_Ball

自己制作的unity官方案例,Roll_A_Ball,在案例的基础上添加了音效。

2015-05-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除