
CUDA-HPC
五道口纳什
wx公众号/B站:五道口纳什
展开
-
OpenMP 并行程序设计入门
1. 杂项Undefined reference to `omp_get_max_threads_’原创 2016-10-30 18:17:42 · 1348 阅读 · 0 评论 -
PBS 作业调度应用
PBS(Portable Batch System),最初由 NASA 的 Ames 研究中心开发,主要为了提供一个能满足异构计算网络需要的软件包,用于灵活的批处理(Portable Batch Process),特别是满足高性能计算的需要,如集群系统、超级计算机和大规模并行系统。原创 2016-10-30 21:35:20 · 1797 阅读 · 0 评论 -
NVIDIA 显卡与 CUDA 在深度学习中的应用
CUDA(Compute Unified Device Architecture),是显卡厂商 NVIDIA 推出的运算平台。 0. 显卡以 GeForce Gtx 1050 不同型号为例,其性能清单基本如下: 重点关注的参数:NVIDIA CUDA Cores,CUDA 核心数;1. CUDA GPUS查看不同系列和类型的 GPU(显卡) 对 CUDA 的兼容和计算能力:CUDA GP原创 2017-02-09 11:47:11 · 4183 阅读 · 0 评论 -
matlab 中使用 GPU 加速运算
为了提高大规模数据处理的能力,matlab 的 GPU 并行计算,本质上是在 cuda 的基础上开发的 wrapper,也就是说 matlab 目前只支持 NVIDIA 的显卡。1. GPU 硬件支持首先想要在 matlab 中使用 GPU 加速运算,需要计算机配备有 NVIDIA 的显卡,可在 matlab 中运行:>> gpuDevice如果本机有 GPU 支持,会列出 CUDADevice原创 2017-02-28 15:51:48 · 28107 阅读 · 1 评论 -
NVIDIA 显卡信息(CUDA信息的查看)
1. nvidia-smi 查看显卡信息在安装完成 NVIDIA 显卡驱动之后,对于 windows 用户而言,cmd 命令行界面还无法识别 nvidia-smi 命令,需要将相关环境变量添加进去。原创 2017-03-15 22:21:31 · 41308 阅读 · 2 评论 -
CPU vs. GPU
现在的 GPU 都 2000 核了,为什么 CPU 才 16 核? CPU:few(less than hundred)cores optimization for sequential serial processing;GPU:thousands of small, efficient cores for parallel processing;1. CPU 的核心数目与 GPU 的核心原创 2017-06-09 10:47:20 · 1139 阅读 · 0 评论 -
BLAS 与 Intel MKL 数学库
Intel MKL(Math Kernel Library),提供了优化的数学计算函数。1. 主要内容BLAS(level 1, 2, 3)和 LAPACK 线性代数程序:支持向量、向量-矩阵、矩阵-矩阵运算;快速傅里叶变换(FFT),向量数学库(Vector Math Libray,VML),优化后的针对向量的数学操作程序;原创 2016-10-30 23:11:35 · 5590 阅读 · 0 评论