CUDA
青花瓷
程序员老炮,喜欢计算机图形学和人工智能,C++,编译器技术等。
展开
-
关于Nvidia的GPU架构的演进
Pascal之后就是Volta,Volta是比较小众的架构,目前已知Tesla V100和TITAN V两款显卡。以下是Pascal架构的一些显卡:目前,最新的架构是Turing(图灵)架构,红色部分就是图灵架构的显卡。基本上Pascal架构和Turing架构是无缝对接的主流架构。...原创 2020-05-02 16:56:56 · 2309 阅读 · 0 评论 -
Cuda的Kernal函数中Block和thread的数量上限测试
#include "cuda_runtime.h"#include "device_launch_parameters.h"#include <stdio.h>#define N 512#define K 64 __global__ void printf_base(){ printf("Hello \n");}void printf_bas...原创 2020-04-30 14:35:04 · 2615 阅读 · 1 评论 -
Cuda下检查网格和块的索引和维度
#pragma region 检查网格和块的索引和维度//这里为何cuda内核函数中,无论Debug版本和Release版本,都无法采用printf进行打印。__global__ void checkIndex(void){ printf("threadIdx:(%d, %d, %d)\n", threadIdx.x, threadIdx.y, threadIdx.z); p...原创 2020-04-28 20:25:43 · 341 阅读 · 0 评论 -
cudaMalloc和cudaMallocManaged的所用时间比较
#include "cuda_runtime.h"#include "device_launch_parameters.h"#include "device_functions.h"#include <stdio.h>#include "opencv2/imgproc/imgproc.hpp"#include "opencv2/imgproc/types_c.h"#...原创 2020-04-30 17:26:58 · 4814 阅读 · 0 评论