Zhang's Wikipedia

玩就玩大的

CPU vs. GPU

现在的 GPU 都 2000 核了,为什么 CPU 才 16 核? CPU:few(less than hundred)cores optimization for sequential serial processing; GPU:thousands of small, efficient ...

2017-06-09 10:47:20

阅读数:407

评论数:0

NVIDIA 显卡信息(CUDA信息的查看)

1. nvidia-smi 查看显卡信息在安装完成 NVIDIA 显卡驱动之后,对于 windows 用户而言,cmd 命令行界面还无法识别 nvidia-smi 命令,需要将相关环境变量添加进去。

2017-03-15 22:21:31

阅读数:22666

评论数:0

matlab 中使用 GPU 加速运算

为了提高大规模数据处理的能力,matlab 的 GPU 并行计算,本质上是在 cuda 的基础上开发的 wrapper,也就是说 matlab 目前只支持 NVIDIA 的显卡。 1. GPU 硬件支持首先想要在 matlab 中使用 GPU 加速运算,需要计算机配备有 NVIDIA 的显卡,可在...

2017-02-28 15:51:48

阅读数:12135

评论数:1

NVIDIA 显卡与 CUDA 在深度学习中的应用

CUDA(Compute Unified Device Architecture),是显卡厂商 NVIDIA 推出的运算平台。 0. 显卡以 GeForce Gtx 1050 不同型号为例,其性能清单基本如下: 重点关注的参数: NVIDIA CUDA Cores,CUDA 核心数; 1....

2017-02-09 11:47:11

阅读数:2537

评论数:0

BLAS 与 Intel MKL 数学库

Intel MKL(Math Kernel Library),提供了优化的数学计算函数。1. 主要内容 BLAS(level 1, 2, 3)和 LAPACK 线性代数程序:支持向量、向量-矩阵、矩阵-矩阵运算; 快速傅里叶变换(FFT), 向量数学库(Vector Math Libray,VML...

2016-10-30 23:11:35

阅读数:2181

评论数:0

PBS 作业调度应用

PBS(Portable Batch System),最初由 NASA 的 Ames 研究中心开发,主要为了提供一个能满足异构计算网络需要的软件包,用于灵活的批处理(Portable Batch Process),特别是满足高性能计算的需要,如集群系统、超级计算机和大规模并行系统。

2016-10-30 21:35:20

阅读数:557

评论数:0

OpenMP 并行程序设计入门

1. 杂项 Undefined reference to `omp_get_max_threads_’

2016-10-30 18:17:42

阅读数:465

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭