自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 资源 (1)
  • 收藏
  • 关注

原创 CentOS下Docker安装和centos+jdk镜像构建与jar包在镜像中启动

1.使用安装包安装(CentOS 7下)Docker 要求 CentOS系统的内核版本高于 3.10 ,查看本页面的前提条件来验证你的CentOS 版本是否支持 Docker 。通过 uname -r 命令查看你当前的内核版本[root@runoob ~]# uname -r 3.10.0-327.el7.x86_642.安装 Docker进入/work目录下载安装包:

2017-11-20 19:59:24 2933

原创 Tartu大学计算机科学系计算神经学小组的学者在robohub网站发表文章,阐述了他们对DeepMind人工智能算法的复现。Playing Atari with Deep Reinforcement.

Tartu大学计算机科学系计算神经学小组的学者在robohub网站发表文章,阐述了他们对DeepMind人工智能算法的复现。       原来论文题目是:Playing Atari with Deep Reinforcement Learning       Tartu大学发表文章是:ArtificialGeneral Intelligence that plays Ata

2017-11-13 19:04:48 542

转载 CUDA从入门到精通

CUDA从入门到精通(零):写在前面在老板的要求下,本博主从2012年上高性能计算课程开始接触CUDA编程,随后将该技术应用到了实际项目中,使处理程序加速超过1K,可见基于图形显示器的并行计算对于追求速度的应用来说无疑是一个理想的选择。还有不到一年毕业,怕是毕业后这些技术也就随毕业而去,准备这个暑假开辟一个CUDA专栏,从入门到精通,步步为营,顺便分享设计的一些经验教训,希望能

2016-11-26 16:20:00 780

原创 GPGPU编程技术-从GLSL、CUDA到OpenCL 平方和算法第三版

//GPGPU编程技术-从GLSL、CUDA到OpenCL 平方和算法第三版 增加计时函数 ////书中程序168页#include <stdio.h>#include <iostream>#include <cuda_runtime.h> // For the CUDA runtime routines (prefixed with "cuda_")#include <device_

2016-11-02 22:26:58 2563

原创 用NVIDIV Visual Profiler 进行分析执行效果

先附上代码,这是上次进行多线程运算的程序。 不同的是最后多了行代码: cudaThreadExit(); //加上这个可以用 NVIDIA visual profiler进行分析 这行代码是保证分析时进行判断是否运行完的,不然分析软件一直会在分析GPU的运行状态,产生无用的垃圾信息。下面是要分析的多线程程序//GPGPU编程技术-从GLSL、CUDA到OpenCL 平方和算法第一版 增加计

2016-10-29 13:52:08 1548

原创 多线程CUDA实例 167页 平方求和

//GPGPU编程技术-从GLSL、CUDA到OpenCL 平方和算法第二版 增加计时函数 没有为主机变量分配内存 多线程求和////书中程序167页#include <stdio.h>#include <iostream>#include <cuda_runtime.h> // For the CUDA runtime routines (prefixed with "cuda_")#

2016-10-28 23:17:16 854

原创 增加计时函数 GPGPU编程技术-从GLSL、CUDA到OpenCL 平方和算法第一版

在本函数中增加了计时的功能,需要time.h库函数已经在头文件中添加。//GPGPU编程技术-从GLSL、CUDA到OpenCL 平方和算法第一版 增加计时函数//书中程序160页#include <stdio.h>#include <iostream>#include <cuda_runtime.h> // For the CUDA runtime routines (prefixed

2016-10-25 23:20:31 917

原创 GPGPU编程技术-从GLSL、CUDA到OpenCL 平方和算法第一版 书中程序158页

//GPGPU编程技术-从GLSL、CUDA到OpenCL 平方和算法第一版//书中程序158页#include <stdio.h>#include <iostream>#include <cuda_runtime.h> // For the CUDA runtime routines (prefixed with "cuda_")#include <DEVICE_LAUNCH_PARA

2016-10-23 11:49:31 825

原创 GPU高性能编程CUDA实战中的book.h

/* * Copyright 1993-2010 NVIDIA Corporation. All rights reserved. * * NVIDIA Corporation and its licensors retain all intellectual property and * proprietary rights in and to this software and rel

2016-10-22 10:57:27 1724

转载 CUDA的内存结构,通过实例展示寄存器和共享内存的使用

本章将介绍CUDA的内存结构,通过实例展示寄存器和共享内存的使用。CUDA内存结构GPU的内存结构和CPU类似,但也存在一些区别,GPU的内存中可读写的有:寄存器(registers)、Local memory、共享内存(shared memory)和全局内存(global memory),只读的有:常量内存(constant memory)和纹理内存(texture memory)。CUDA To

2016-10-20 16:23:49 3018

原创 CUDA矩阵加法

实现矩阵相加 有可能相关库没有加载上 请自行加载#include <stdio.h>#define N 1024#define TPB 16__global__ void MatAdd(int A[N][N], int B[N][N], int C[N][N]){ int i = blockIdx.x * blockDim.x + threadIdx.x; int j = bl

2016-10-20 16:11:29 2514

原创 检测GPU属性

本代码可以检测设备属性int main(void){ cudaDeviceProp prop; int count; cudaGetDeviceCount(&count); printf("cuda device count: %d\n", count); for (int i = 0; i < count; ++i) {

2016-10-20 16:06:28 584

原创 CUDA一维线程

自己敲的第一个并行计算程序/**实现线程的显示*/#include <stdio.h>#include <iostream>#include <cuda_runtime.h> // For the CUDA runtime routines (prefixed with "cuda_")#include <DEVICE_LAUNCH_PARAMETERS.h> //我在查询中找到的头文件 有可能有

2016-10-18 18:03:36 614

原创 SIMT ( Single Instruction Multiple Threads)

按照费林分类法,S IM T也属于S IM D的范畴,因为它也足在多个数据上执行相同的指令。但在程序实现的过程中,S IM T允许由用户来分配线程, 并行计算也是以线程为单位的。说得具体牲,CUDA为每个线程指定了标识符(编号)。在已知数暈的数据上,SIMT模型可以指定f t定义数H的线程,并根据线程标识符设计线程与数据关联的映射法则。在S IM T模型中, 用户可以只分配一个

2016-10-13 18:47:46 1341

原创 并行计算分类

并行计算分类

2016-10-13 18:39:20 1865

转载 CUDA安装

CUDA安装经历了几天的安装终于把CUDA安装上了。1.cuda官方下载网址,目前最新版本为cuda7.5,选择自己系统对应的版本下载安装程序。2.运行cuda_ 7.5.18_windows.exe,程序会检测系统的兼容性如下图: 3.选择“同意并继续”,进入下图安装过程 (备注:安装cuda时,要关闭所有的vs程序) 4.等待大概半个小时后,安装程序终于完成了。

2016-10-13 17:06:05 1112

原创 第一个CUDA程序

第一个CUDA程序/*** addition: C = A + B.** This sample is a very basic sample that implements element by element* vector addition. It is the same as the sample illustrating Chapter 2* of the programming gui

2016-10-13 17:02:42 356

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除