自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 资源 (9)
  • 收藏
  • 关注

原创 GPU与MIC对比

属性 NVIDIA GPU Intel MIC 单核 流处理器/CUDA core 每个核运行一个线程 X86 core 每个核上最多支持4个硬件线程 主频 接近1GHz 1.0-1.1GHz 核数 数十个到数千个 57-61 并行度

2014-09-29 21:02:54 7919

原创 快速开发CUDA程序的方法

根据几年的CUDA开发经验,简单的介绍下CUDA程序的大概开发步骤,按照先修改CPU串行程序后移植到GPU平台的原理,把需要在GPU上做的工作尽量先在CPU平台上修改,降低了程序的开发难度,同时有利用bug的调试。通过实现一种快速、有效地CUDA并行程序开发的方法,提高CUDA并行程序开发效率,降低CUDA并行程序开发周期和难度。 (1)    CPU串行程序分析 对于CPU串行程序,首先需要

2014-09-22 18:19:52 3871 1

高性能计算

高​性​能​计​算各方面知识汇总​:​高​性​能​计​算​中​用​到​的​测​试​程​序​、​存​储​系​统​、​网​络​系​统​、​集​群​管​理​系​统​、​并​行​开​发​环​境​、​并​行​开​发​策​略​、​容​错​等

2015-11-23

利用高性能计算加速深度学习算法

介绍利用GPU加速深度学习算法,涉及模型并行和数据并行,主从模式和令牌环模式通信,满足GPU集群数据划分方法;最后介绍了利用FPGA加速线上识别算法,提高性能功耗比

2015-11-03

Programming Massively Parallel Processors

伊利诺伊大学胡文美教授的关于CUDA编程语言的电子书

2010-07-14

基于GPU平台的SimpleScalar并行模拟实现.pdf

基于GPU平台的SimpleScalar并行模拟实现 Realization of Parallel SimpleScalar Simulator on GPU Platform

2009-11-29

Parallel Branch Prediction on GPU Platform.pdf

Parallel Branch Prediction on GPU Platform

2009-11-29

GPU+CUDA学习资料

GPU+CUDA CUDA学习资料 CUDA PPT

2009-11-29

NVIDIA_OpenCL_BestPracticesGuide

NVIDIA_OpenCL_BestPracticesGuide.pdf

2009-11-29

ToolsGCC 中文手册

ToolsGCC 中文手册 Linux GCC

2009-11-29

跟我一起写 Makefile

跟我一起写 Makefile Linux Makefile

2009-11-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除