
CUDA
青花瓷
程序员,喜欢计算机图形学和人工智能,C++,编译器技术等。热爱棋类、游泳、绘画。
展开
-
采用离线包安装Cuda版本的Torch
如何离线方式安装cuda版本的Torch。原创 2025-02-24 11:28:42 · 324 阅读 · 0 评论 -
Pytorch_cuda版本的在线安装命令
Pytorch_cuda版本的在线安装命令原创 2024-08-12 21:41:39 · 545 阅读 · 0 评论 -
Pytorch离线文件的快速下载
可以方便的安装Cuda版本的Pytorch,比较方便快捷。系统重装后,可以快速的重新搭建系统。Cuda、torch、python三种不同版本组合的离线安装文件都可以找到。但是从官网下载的速度是受到限制的,一般恒定在256K/秒,所以下载一个。直接用文件方式安装Cuda版本的Pytorch。总的来说,感觉还是阿里的离线文件下载更加方便。Torch_cuda的whl需要2个半小时。原创 2024-08-11 21:26:28 · 1664 阅读 · 0 评论 -
直接用文件方式安装Cuda版本的Pytorch
直接用文件方式安装Cuda版本的Pytorch原创 2024-08-06 19:39:15 · 394 阅读 · 0 评论 -
关于Nvidia的GPU架构的演进
Pascal之后就是Volta,Volta是比较小众的架构,目前已知Tesla V100和TITAN V两款显卡。以下是Pascal架构的一些显卡:目前,最新的架构是Turing(图灵)架构,红色部分就是图灵架构的显卡。基本上Pascal架构和Turing架构是无缝对接的主流架构。...原创 2020-05-02 16:56:56 · 2471 阅读 · 0 评论 -
Cuda的Kernal函数中Block和thread的数量上限测试
#include "cuda_runtime.h"#include "device_launch_parameters.h"#include <stdio.h>#define N 512#define K 64 __global__ void printf_base(){ printf("Hello \n");}void printf_bas...原创 2020-04-30 14:35:04 · 2845 阅读 · 0 评论 -
Cuda下检查网格和块的索引和维度
#pragma region 检查网格和块的索引和维度//这里为何cuda内核函数中,无论Debug版本和Release版本,都无法采用printf进行打印。__global__ void checkIndex(void){ printf("threadIdx:(%d, %d, %d)\n", threadIdx.x, threadIdx.y, threadIdx.z); p...原创 2020-04-28 20:25:43 · 406 阅读 · 1 评论 -
cudaMalloc和cudaMallocManaged的所用时间比较
#include "cuda_runtime.h"#include "device_launch_parameters.h"#include "device_functions.h"#include <stdio.h>#include "opencv2/imgproc/imgproc.hpp"#include "opencv2/imgproc/types_c.h"#...原创 2020-04-30 17:26:58 · 5191 阅读 · 0 评论