cuda
文章平均质量分 54
小_小_杨_
Fly without wings!
展开
-
CUDA 入门学习(一)
cuda编程步骤1、先设置Device,使用的函数cudaError_t cudaStatus = cudaSetDevice(0);2、分配GPU内存使用的函数 第一个参数是指向指针的指针,第二个参数是分配内存的大小cudaError_t cudaStatus = cudaMalloc((void**)&dev_c, size * sizeof(int));3、给GPU内存执行赋值或者读取GP原创 2016-04-28 15:57:15 · 1796 阅读 · 0 评论 -
CUDA 学习(二)
test原创 2016-04-28 08:42:32 · 2627 阅读 · 0 评论 -
cuda reduce学习
这个程序实现的是加法的并行运算:#include <stdio.h>#include <time.h>#include <stdlib.h>#include <cuda_runtime.h>__global__ void parallel_reduce_kernel(float* d_out, float* d_in){ int myID = threadIdx.x + blockI原创 2016-09-12 20:36:11 · 1275 阅读 · 0 评论 -
cuda 学习(三) Page-Locked Host Memory
一、cudaHostAlloc的使用#include <iostream>#include <numeric>#include <stdlib.h>__global__ void add1(float* input){ int idx = threadIdx.x; input[idx] += idx;}int main(void){ float* temp;原创 2016-09-08 20:14:17 · 1556 阅读 · 0 评论 -
caffe-yolo 训练
#include <algorithm>#include <cfloat>#include <vector>#include "thrust/device_vector.h"#include "caffe/layer.hpp"#include "caffe/layers/normalize_layer.hpp"#include "caffe/util/math_functions.hpp"n原创 2016-09-02 17:05:02 · 7894 阅读 · 29 评论 -
gpu cuda部分参数学习
Maximum number of threads per block: 1024 Max dimension size of a thread block (x,y,z): (1024, 1024, 64) Max dimension size of a grid size (x,y,z): (2147483647, 65535, 65535) 第一个参数表原创 2016-12-15 21:21:06 · 523 阅读 · 0 评论 -
cublasSgemm函数
cublasStatus_t cublasSgemm (cublasHandle_t handle, cublasOperation_t transa,cublasOperation_t transb, int m,int n,int k,const float *alpha, /* host or device pointer */ const float *A, int ld原创 2016-12-15 21:46:40 · 5049 阅读 · 0 评论 -
NVCC简单学习
1、NVCC Identification Macro 预定义的宏,并且给出NVCC的版本号 nvcc predefines the following macros: NVCC Defined when compiling C/C++/CUDA source files. CUDACC Defined when compiling CUDA source files. CUDACC_原创 2017-01-25 19:41:57 · 3765 阅读 · 0 评论