自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(48)
  • 资源 (25)
  • 收藏
  • 关注

原创 TVM个人实验(一)--TVM在ubuntu下安装

TVM安装

2023-04-26 10:16:26 756

原创 RenderDoc安卓端Vulkan抓帧1

RenderDoc Android Vulkan

2023-01-06 14:42:56 1205

翻译 理解Vulkan中的各种对象

学习Vulkan API的一个重要部分是了解其中定义了哪些类型的对象,它们代表了什么,以及它们如何相互关联。为了帮助解决这个问题,创建了一个图表,展示了所有vulkan对象及其一些关系,尤其是从另一个对象创建对象的顺序。每个vulkan对象都是具有前缀Vk的特定类型的值。为了清楚起见,图表中省略了这些前缀,就像函数名vk前缀一样。例如图中的Sampler表示一个名为Vksampler的vulkan对象类型。这些类型不能当成指针或者普通的数值。不能以任何方式解释这些类型的值。只需将它们视为...

2022-03-08 09:54:10 1063

原创 SPIR-V教程 -- SPIRV变量

在GLSL中,一个浮点的全局变量的定义很简单,如下:float var;在SPIRV中,如何定义一个浮点的变量呢?SPIR-V中没有预定义任何类型,在定义一个变量之前,需要定义一个类型。浮点类型在SPIR-V手册中,浮点的类型的定义为:OpTypeFloat对于 OpTypeFloat 指令,文档中的指令格式为:3 22 Result<id> Literal Width 其...

2022-01-27 23:57:42 1417

原创 SPIR-V教程 -- SPIR-V介绍(一)

SPIR-V是描述vulkan使用的着色器的语言。通常,这些着色器用例如GLSL之类的高级语言编写,但有时可能需要查看、调试或修改相应的SPIR-V。这个教程目的在于一地的那点地介绍这些语言,使其更容易阅读。SPIR-V语言采用SSA(Static single assignment)格式,是一个非常抽象的语法树(带有标题)。这意味着每个中间结果只写入一次。将其视为一种语言,每个变量都是const,就想函数式语言一样。在七班几个教程中,将重点关注标题。 ...

2022-01-26 00:07:13 2926

原创 shader_subgroup_vote概述

工作上遇到vulkan的一个扩展“VK_EXT_shader_subgroup_vote”,很讨厌的是在安卓GPU上,不支持这个扩展。所以研究了下这个扩展到底是如何使用的。 根据vulkan文档和OpenGL文档描述,提供了内置函数来计算一个group中一组布尔条件的组合,涉及到三个函数: 1)OpSubgroupAnyKHR/anyInvocationARB(bool value) 对于这个函数,如果在group中,至少有一个线程对于value 的条件成立...

2022-01-20 11:34:11 337

原创 博客不更新

CSDN博客不更新了,请移步个人站点:www.gpu-computing.cn

2017-09-23 23:08:49 424

原创 编译原理-1-词法分析

在上一篇文章中,大致介绍了下编译过程。从这篇文章开始,我们就开始逐步慢慢深入的学习编译过程中的步骤。今天我们就来具体看看词法分析到底是怎么回事。========================华丽丽的分割线============================================     int fun(int a,int c);int m=10;int main(){

2016-04-12 01:35:26 1027

原创 编译原理-0-编译过程概述

一直以来,都想好好学习学习编译原理。但是一直各种理由没有静下心来好好看看。现在就用博客的形式,记录自己学习编译原理的点点滴滴。如有错误之处,还请指出。    习惯糗事百科的分割,咱就先来一个华丽丽的分隔符    ===============================分隔符=============================================      对于我

2016-04-12 00:44:36 781

原创 OpenACC2.0标准中文版

OpenACC2.0标准中文版下载地址,请移步这里      昨天晚上睡前突然想到这茬,然后又从网盘里找出自己翻译的版本,上传至CSDN上。      自己应该是2012年2~3月份开始接触的OpenACC,其实自己在看OpenACC1.0标准时就想过去翻译,在学校每天可干的事情太多了,自己也就想想而已。所以OpenACC1.0标准中文版的作者是小小河。     2013年5月份,2.

2015-07-13 16:19:28 1848

原创 OpenCL2.0特性之SVM

在OpenCL2.0中,增加了SVM(shared virtual memory)的特性。在开始讲解SVM之前,我们先用图片来看下OpenCL1.2中主机与设备端的地址空间:                                                 图1 OpenCL1.2中主机与设备端地址空间        从图1可以看到,主机与设备具有不同的地址空间,各自

2015-06-04 16:02:03 6845 3

原创 安卓平台ARM Mali OpenCL例子-灰度转换

手头一块RK3288的板子,在板子上测试了1080p一个灰度转换的OpenCL例子。OpenCL没有任何优化。例子请移步这里。 该例子是编译成安卓平台下的可执行程序。    进入jni文件夹,进行如下操作     ndk-buildadb push ../libs/armeabi-v7a/opencl /mnt/sdcard/opencl/grayadb push kernel.cl

2015-04-09 00:50:53 4639 8

原创 安卓平台下ARM Mali OpenCL编程-GPU信息检测

对于ARM Mali GPU,目前是支持OpenCL1.1,所以我们可以利用OpenCL来计算我们的计算。              一直以来,对于Mali GPU的OpenCL编程,一直没有环境来测试。好不容易弄到一个华为Mate7,却因为华为没有提供OpenCL driver。目前测试过的手机有魅族MX4 pro T628是带有OpenCL Driver,这个还得多亏三星的猎户座芯片。对于

2015-04-08 01:14:28 12073 11

原创 巧用CUDA中的pinned memory

这几天看别人的论文,发现一个比较有意思的实现方式。巧用pinned memory,在GPU中实现类似pipeline的功能。在论文中pipeline中,有四个操作:地址生成,数据组装,数据拷贝和计算。对于地址生成和计算是在GPU中操作的。      详细的请看一个例子:     1、我们假设有两个thread block,对于第一个block计算地址空间(在例子中省略了),在第一个bloc

2015-03-25 00:53:44 1905 1

原创 GNU ARM汇编伪指令之循环

GNU ARM汇编中,支持如下形式的循环结构:.rept times code.endr code 表示一段代码,.rept和.endr都是汇编伪指令,times是一个数字,表示code这段代码要重复执行的次数。另一种循环的形式如下:.irp param,val1,val2... code.endr其中.irp也是汇编伪指令。param是一个参数名,其后的va

2015-02-13 09:36:13 3509

原创 Qt导出图片到Excel中

手头一个石油项目,需要把管柱序列中的工具信息导出到Excel中,遇到的难点是导出图片。现在给出自己的实现例子:QString filename = QFileDialog::getSaveFileName(this, tr("保存管柱序列"),"",tr("*.xls")); //选择路径 if(filename.isEmpty()) { QMe

2015-02-05 09:54:45 5074 2

原创 ARM C嵌套汇编&NEON运算小例子

#include #include #include int main(){ int x[10]={0}; int *x_value; x_value=x; int data; asm( " str fp, [sp, #-4]! \n\t" " add fp, sp, #0 \n\t"        /*1-8*/ " mov r

2015-02-05 09:51:21 899

原创 账号被盗

几天没上博客,发现有几篇莫名其妙的文章,一一删除之后发现,我自己写的关于CUDA静态库的博客被删了,唯一庆幸的是用有道云笔记保存下来了。

2015-01-12 23:11:53 1498

原创 PowerVR 6系列架构分析

Imagination Technologies公司的PowerVR GPU在移动GPU端,还是老大位置。从PowerVR 6系列开始,越来越向GPU的通用计算靠齐了。以魅族MX4,苹果6的手机开始,6系列的GPU在市场上也慢慢铺开。现在我们就来解析下PowerVR 6序列GPU的架构吧。      从上图可以看出,6系列的GPU主要包含Compute Data Master, Coars

2014-11-27 17:38:44 1376

原创 linux下CUDA动态库

代码在这里,

2014-11-24 17:09:26 1113

原创 linxu下CUDA静态库-下

在这里,有yixi

2014-11-24 14:36:59 2454 1

原创 linxu下CUDA静态库-上

项目需要把CUDA打包成静态库,弄了一个小

2014-11-12 15:46:29 849

原创 Qt绘制圆

最近开始折腾Qt了,手头上的一个项目需要用到Qt来huizhi

2014-10-14 16:23:56 8136

原创 安卓NDK下读取文件

这几天一直在弄模板生成算法移植到手机GPU上。

2014-08-06 15:22:55 1692 1

原创 CUDA Fortran不必要数据拷贝

首先请看下面的代码:module add use cudafor contains attributes(global) subroutine call_global(a) integer :: a(:) integer :: i i=threadIdx%x+(blockIdx%x-1)*blockDim%x a(i)=i end subroutine call_glo

2014-07-30 19:35:53 2516 2

原创 安卓手机GPU OpenCL总结

前段时间,把市面上手机GPU OpenCL支持情况做了一个总结,如下。

2014-07-23 15:00:22 9139 9

原创 安卓下PowerVR OpenCL编程

目前对于PowerVR,

2014-07-23 11:53:53 4817 11

原创 RenderScript控制并行化线程数量

在这里,我们只是把10个数组的计算展开。但是在实际得项目中,有时需要人为设定线程数量。此时,rs_script_call就可以发挥作用了。rs_script_call结构体定义如下:00110 typedef struct rs_script_call {00111 enum rs_for_each_strategy strategy;00112 uint32_t

2014-07-11 13:50:01 980

原创 RenderScript多个输入处理

在RenderScript中,默认情况下对应一个输入,一个输出。但是在实际使用过程中,youshi

2014-07-11 11:47:09 822

转载 FFTW安卓平台下编译

借用http://he-kai.com/2014/01/16/%E7%BC%96%E8%AF%91%E4%B8%94%E7%A7%BB%E6%A4%8Dfftw3%E5%88%B0android%E6%89%8B%E6%9C%BA%E4%B8%8A2/中的内容。     编译

2014-06-27 14:15:42 1789 1

原创 CUDA Fortran for Scientists and Engineers第二版翻译

下午听朋友说,NV把CUDAFortran for Scientists and Engineers的出版权卖给了国内某出版商。第一反应是

2014-06-24 16:40:15 1611

转载 android NDK调试

今天状态很一般,在写OpenCL代码时,

2014-05-20 15:07:18 1467

原创 高通平台下安卓opencl小例子

1、从高通官网下载Adreon SDK,最新

2014-05-19 18:02:00 10176 19

原创 android NDK 小例子step by step

1、eclipse中设置NDK   打开eclipse,在window->preferences

2014-05-16 14:33:37 2253 2

原创 复数矩阵计算行列式

#include#include#include#include#include#include using namespace std;#define ROW 25#define COL 25typedef struct { float Real; float Image;}Complex;Complex add(Complex a,Complex b){

2014-05-09 16:42:52 11455

原创 clCompileProgram&clLinkProgram

在OpenCL1.1中,创建program,直接用clBuildProgram即可。   在OpenCL1.2中,新添加了一种方式:先compiler(clCompileProgram),再linker(clLinkProgram)。   具体用法,请看下面的例子:   kernel.cl文件,调用了add.h中的add函数,#include"add.h"__kernel void

2014-03-13 12:02:24 1637

原创 OpenACC2.0-routine

对于OpenCC1.0中,没有定义函数调用,用户自定义的函数调用只能通过内联(inline)的方式,在编译时需要添加编译选项:-Minline.在OpenACC2.0中,新添加了routine导语,来实现用户自定义函数调用。下面我们来看一个例子:#include#pragma acc routine workerint sum(int n,float *A){

2014-03-12 22:35:28 1538

原创 clCreateBuffer参数说明

clCreateBuffer第二个参数可以有多种,详情请点击此次,对于前三个比较简单,在次就忽略。1、CL_MEM_USE_HOST_PTR  对于CL_MEM_USE_HOST_PTR,刚开始buffer object的值是来自于host_ptr,但buffer object处理之后,host_ptr中的值如何变化,这点在OpenCL中没有定义。那就看看A卡对次是如何处理,一个小程序

2014-02-21 13:45:10 7245 2

原创 hdfs c程序在hadoop伪分布式执行问题

采用C语言,利用libhdfs实现对hdfs的操作。但是在程序运行时报错:错误如下:hadoop@node1:~/hadoop-1.2.1/sample$ ./test 十二月 17, 2013 11:44:38 上午 org.apache.hadoop.ipc.Client$Connection handleConnectionFailure信息: Retrying connect

2013-12-17 12:51:20 1138

原创 Hadoop伪分布式安装体验

这段时间有空想研究MapReduce,于是选择安装Hadoop。只有一台机器,就选择了伪分布式安装。1、从官网下载Hadoop2.22、把安装包解压到当前用户名的主目录下。(也可以把Hadoop解压放置到其他地方,但是请确保该文件夹的所有者是执行hadoop操作的用户)3、设置ssh的无密码访问,详情请移步这里4、安装JAVA环境,详情请移步这里5、对Hadoop的设置:

2013-12-04 15:10:18 641

HLSL Development Cookbook

专注于讲解 HLSL 的书籍,重点在 HLSL 以及源码,关于 DirectX 的篇幅很少

2019-01-24

OpenACC2.0中文版

这是2013年7~8月份自己翻译的OpenACC2.0的标准。

2015-07-13

SVM粗/细粒度粒子

AMD平台下 ,OpenCL SVM 粗/细粒度缓冲SVM粒子。VS工程。

2015-06-04

安卓平台下Mali-OpenCL例子

该例子是安卓平台下Mali运行 OpenCL代码,对1080P的彩色图灰度转换。例子说明请看我博客文章。

2015-04-09

Qt图片导出到Excel中

把Qt中的图片,导出保存到Excel中的小例子

2014-12-05

fftw安卓平台

fftw源码编译安卓平台可使用的fftw,对应版本为fftw3.3.4

2014-06-27

CUDA Fortran for Scientists and Engineers第二版第三章

CUDA Fortran for Scientists and Engineers第二版第三章和附录翻译。

2014-06-24

cuda fortran cufft

这是自己在VS2012下,使用PVF弄的一个fortran调用CUFFT的例子。

2013-08-20

差分遗传算法

差分遗传算法,C++版不是C语言版的哈,需要的下吧。

2012-06-13

基于Open CL的MD5破解算法

基于OpenCL的MD5破解算法,利用OpenCL破解MD5

2012-06-13

基于CUDA架构的MD5破解方法研究

基于CUDA架构的MD5破解方法研究,利用CUDA破解MD5

2012-06-13

CUDA Application Design and Development

CUDA Application Design and Development,英文版。目前还没有中文版的。书内容还可以。

2012-06-13

Cuda Application Design and Development 2011

cuda资料,需要的下吧。自己也没好好的看过这书

2012-02-13

CUDA范例精解通用GPU编程

CUDA范例精解通用GPU编程,个人觉得讲的还行。

2011-11-09

GPU高性能运算之CUDA

GPU高性能运算之CUDA,cuda基础入门的书吧。个人觉得还行

2011-11-09

消息传递并行编程环境MPI

消息传递并行编程环境MPI,电子版的书,需要的下。

2011-11-09

GPU高性能计算之CUDA实例

GPU高性能计算系列丛书的第一本《GPU高性能计算之CUDA》已经出版,由张舒,褚艳利,赵开勇,张钰勃所编写。本书除了详细介绍了CUDA的软硬件架构以及C for CUDA程序开发和优化的策略外,还包含有大量的实例供读者学习参考用。 下表是各个实例的介绍列表。 文件夹 对应书中章节 备注 ACsearch_DPPcompact_with_driver 5.2.2 AC多模式匹配算法 asyncAPI 2.5 异步API调用示例 bandwidthTest 2.3.6 带宽测试 Bitonic 5.1.1 双调排序网络 conjugateGradient 5.2.1 共轭梯度算法,CUBLAS实现 cudaMPI 2.7.3 CUDA+MPI管理GPU集群 cudaOpenMP 2.7.2 CUDA+OpenMP管理多GPU deviceQuery 2.1.4 设备查询 histKernel 2.4.3 亮度直方图统计 matrixAssign 2.1.4 矩阵赋值 matrixMul 4.7.1 矩阵乘法,利用shared memory matrixMul_Berkeley 4.7.1 矩阵乘法,利用register reduction 4.7.2 并行归约(缩减)程序 scan 5.1.2 Scan算法,例如计算前缀和 scanLargeArray 5.1.2 Scan算法,可以处理大数组 simpleCUBLAS 5.1.3 CUBLAS库的简单应用 simpleCUFFT 5.1.4 CUFFT库的简单应用 simpleD3D9 2.6.2 CUDA与Direct3D 9互操作 simpleD3D10 2.6.2 CUDA与Direct3D10互操作 simpleGL 2.6.1 CUDA与OpenGL互操作 simpleMultiGPU 2.7.1 多设备控制 simpleStreams 2.5.2 流的使用演示 simpleTexture 2.3.8 简单的纹理使用 simpleTextureDrv 2.3.8 简单的纹理使用,驱动API 实现 sortingNetworks 5.1.1 双调排序网络,处理大数组 threadMigration 2.7.1 通过上下文管理和设备管理功能实现多设备并行计算 timing 4.2.1 设备端测时 transpose 4.7.3 矩阵转置 transposeDiagonal 4.7.3 矩阵转置,考虑partition conflict VectorAdd 2.2.3/2.3.4 矢量加 VectorAddDrv 2.2.3/2.3.4 矢量加,驱动API实现 【备注】以上工程,均在Windows XP 64-bit + Tesla C1060 + CUDA 2.3 + VS2005环境下测试通过。

2011-11-08

MPI参考手册

MPI库的一些API函数,可以当作手册来使用。

2011-10-03

Linux设备驱动开发详解

Linux设备驱动开发详解,要的自己下哈。不多说什么。

2011-09-16

嵌入式Linux应用程序开发标准教程

嵌入式Linux应用程序开发标准教程,需要的人下吧。

2011-09-16

qq聊天程序--C#版

qq聊天程序,qq聊天程序--C#版,qq聊天程序,qq聊天程序--C#版

2008-11-21

ASP.NET站点高级编程示范----BookShop目录

ASP.NET站点高级编程示范----BookShop目录

2008-11-21

ASP.NET站点高级编程示---bbs

ASP.NET站点高级编程示---bbs,

2008-11-21

开发人员的NET设计规范

NET设计规范,开发人员。开发人员。开发人员。

2008-11-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除