CUDA
edgelee
这个作者很懒,什么都没留下…
展开
-
CUDA:simpleMPI
Sample: simpleMPIMinimum spec: SM 3.0Simple example demonstrating how to use MPI in combination with CUDA.Key concepts:CUDA Systems IntegrationMPIMultithreadingsimpleMPI.h/* * Copyright 1993-2015 NVIDIA Corporation. All rights reserved. *原创 2021-10-28 11:43:49 · 295 阅读 · 0 评论 -
CUDA:cudaOpenMP
Sample: cudaOpenMPMinimum spec: SM 3.0This sample demonstrates how to use OpenMP API to write an application for multiple GPUs.Key concepts:CUDA Systems IntegrationOpenMPMultithreading/* * Copyright 1993-2015 NVIDIA Corporation. All rights r.原创 2021-10-28 11:08:11 · 476 阅读 · 0 评论 -
CUDA:cppOverload
Sample: cppOverloadMinimum spec: SM 3.0This sample demonstrates how to use C++ function overloading on the GPU.Key concepts:C++ Function OverloadingCUDA Streams and EventscppOverload_kernel.cuh__global__ void simple_kernel(const int *pIn, int.原创 2021-10-28 10:56:59 · 286 阅读 · 0 评论 -
CUDA:cppIntegration
Sample: cppIntegrationMinimum spec: SM 3.0This example demonstrates how to integrate CUDA into an existing C++ application, i.e. the CUDA entry point on host side is only a function which is called from C++ code and only the file containing this functio原创 2021-10-28 10:50:49 · 193 阅读 · 0 评论 -
CUDA:clock_nvrtc
Sample: clock_nvrtcMinimum spec: SM 3.0This example shows how to use the clock function using libNVRTC to measure the performance of block of threads of a kernel accurately.Key concepts:Performance StrategiesRuntime Compilationclock_kernel.cu.原创 2021-10-28 10:40:51 · 195 阅读 · 0 评论 -
CUDA:clock
Sample: clockMinimum spec: SM 3.0This example shows how to use the clock function to measure the performance of block of threads of a kernel accurately.Key concepts:Performance Strategies/* * Copyright 1993-2015 NVIDIA Corporation. All rights .原创 2021-10-28 09:55:21 · 157 阅读 · 0 评论 -
CUDA:simplePrintf
Sample: simplePrintfMinimum spec: SM 3.0This CUDA Runtime API sample is a very basic sample that implements how to use the printf function in the device code. Specifically, for devices with compute capability less than 2.0, the function cuPrintf is call原创 2021-10-28 09:49:20 · 207 阅读 · 0 评论 -
冒泡、归并、双调排序的GPU实现
在第五讲中我们学习了GPU三个重要的基础并行算法: Reduce, Scan 和 Histogram,分析了 其作用与串并行实现方法。 在第六讲中,本文以冒泡排序 Bubble Sort、归并排序 Merge Sort 和排序网络中的双调排序 Bitonic Sort 为例, 讲解如何从数据结构课上学的串行并行排序方法转换到并行排序,并附GPU实现代码。在并行方法中,我们将考虑到并行方法需转载 2017-09-15 09:32:29 · 2498 阅读 · 0 评论 -
光线投射与光线跟踪算法归纳
目录前言三维可视化与体绘制Ray Tracing vs. Ray Casting体绘制的加速技术基于CUDA实现Ray-Casting后话参考文献 1. 前言在读了大牛们的很多深入浅出的科普文章和教程系列并受益匪浅后,不免有自己尝试写写的冲动。本文将尽量平白地阐述一些基本概念和算法流程,同时尽可能多地给出进一步学习所需要的有用资料,一些关键链接就省去了,感兴趣者可以转载 2017-04-14 14:48:56 · 15731 阅读 · 0 评论 -
CUDA constant memory 常量内存最佳练习
CUDA Constant Memory Best Practices__constant__ int array[1024];__global__ void kernel1(int *d_dst) { int tId = threadIdx.x + blockIdx.x * blockDim.x; d_dst[tId] = array[tId];}__globa转载 2017-03-15 17:25:47 · 1949 阅读 · 0 评论 -
Ubuntu 16.04安装配置TensorFlow GPU版本
requirementsUbuntu 16.04python 2.7Flasktensorflow GPU 版本安装nvidia driver经过不断踩坑的安装,终于google到了靠谱的方法,首先检查你的NVIDIA VGA card modelsudo lshw -numeric -C display可以看到你的显卡信息,比如我的就是 product: GM1转载 2016-12-15 15:07:59 · 2314 阅读 · 0 评论 -
Ubuntu 16.04安装NVIDIA GTX 1070和TensorFlow指南
0. 准备工作硬件:NVIDIA GTX 1070显卡一块软件:Ubuntu 16.04.1/CUDA 8.0 RC/cuDNN 5.1/TensorFlow 0.10.01. 安装Ubuntu 16.04.12. 安装NVIDIA 365.35 驱动程序1234sudoadd-apt-repository ppa:gra转载 2016-12-15 13:13:14 · 3715 阅读 · 0 评论 -
CUDA与OpenGL交互开发
最近在学习OpenGL,过程中需要使用CUDA进行并行计算。因此,需要解决OpenGL与CUDA的交互问题。学习记录如下:Step1. 共享数据区想到交互,不难想到通信,数据共享等词语。这里使用的是共享数据的方式来完成OpenGL与CUDA的交互。而OpenGL与CUDA都有着自己独特的类型定义。因此,对于共享的数据区,我们需要给它起两个不同的名字,分别为OpenGL以及CUDA服务转载 2017-03-20 14:38:17 · 573 阅读 · 0 评论 -
CUDA cuFFT使用
CUDA中 cuFFT的使用1.流程使用cufftHandle创建句柄 使用cufftPlan1d(),cufftPlan3d(),cufftPlan3d(),cufftPlanMany()对句柄进行配置,主要是配置句柄对应的信号长度,信号类型,在内存中的存储形式等信息。cufftPlan1d():针对单个 1 维信号 cufftPlan2d():针对单个 2转载 2017-02-22 11:23:53 · 7689 阅读 · 2 评论 -
Ubuntu 16.04 CUDA函数库调用问题解
问题:点击打开链接装好CUDA8.0, samples也安装成功,编译也成功了,但是在运行程序的时候出问题了。譬如进入NVIDIA_CUDA-8.0_Samples/7_CUDALibraries/ 目录中,执行 ./conjugateGradientPrecond 结果报错了,居然报错了:./conjugateGradientPrecond: error while loadin原创 2016-12-23 17:46:48 · 1271 阅读 · 0 评论 -
Ubuntu16.04+cuda8.0+caffe安装教程
1、安装nvidia驱动首先去官网上查看适合你GPU的驱动(http://www.nvidia.com/Download/index.aspx?lang=en-us) 例如,本人的GPU适合的驱动如图: 执行如下语句,安装sudo add-apt-repository ppa:graphics-drivers/ppasudo apt-get updatesudo apt-get转载 2016-12-15 13:25:07 · 1937 阅读 · 0 评论 -
CUDA:异步并发执行的概念
1.主机和设备间异步执行 为了易于使用主机和设备间的异步执行,一些函数是异步的:在设备完全完成任务前,控制已经返回给主机线程了。它们是: 内核发射; 设备间数据拷贝函数; 主机和设备内拷贝小于64KB的存储器块时; 存储器拷贝函数中带有Async后缀的; 设置设备存储器的函数调用。 程序员可通过将CUDA_LAUNCH_BLOCKING环境变量设置为1来全局禁用所有运行在系统上的应用的转载 2016-12-15 12:38:19 · 1758 阅读 · 0 评论