![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
intel xeon phi
文章平均质量分 53
天山
精通C/C++/Fortran、MPI、OpenMP、CUDA等编程语言
精通大规模并行计算软件开发
精通GPU、MIC异构并行编程技术,熟悉并行计算编程模型
熟悉SSE、AVX等硬件加速指令集
熟悉Intel vTune、MPI Trace、Profiler等分析工具
展开
-
MIC编程(3)——MIC峰值性能计算方法
SE10P:1. 单精度峰值性能: 32 SP FLOPs/clock/core * 61 cores * 1.1GHz =2147.2 GFLOP/s 2. 双精度峰值性能: 16 DPFLOPs/clock/core * 61 cores * 1.1GHz = 1073.6 GFLOP/s 3. 内存带宽: 4 Bytes/channel * 16 mem. channe原创 2013-05-24 20:49:16 · 3451 阅读 · 0 评论 -
获取MIC的核数、内存大小
1. 在C/C++代码中获取MIC的核数的方法如下: #define mic_setup_command "micinfo | grep Active | head -1 | awk ' { print $7 }'" FILE *fp; fp = (FILE*)popen(mic_setup_command, "r"); char tmp_buffer[100原创 2014-03-27 16:42:44 · 1775 阅读 · 1 评论 -
GPU与MIC对比
属性NVIDIA GPUIntel MIC单核流处理器/CUDA core每个核运行一个线程X86 core每个核上最多支持4个硬件线程主频接近1GHz1.0-1.1GHz核数数十个到数千个57-61并行度原创 2014-09-29 21:02:54 · 7935 阅读 · 0 评论 -
MIC编程优化(1)——并行度优化
MIC卡包含众多的物理核,同时每个核上可以开启4个线程,因此,程序员只有设计足够多的线程/进程才可以把所有的核利用起来。例如一块60个核的MIC卡上,我们最多可以开启240个线程,最佳线程数一般是每个核设置3个或4个线程原创 2013-08-15 17:14:11 · 3596 阅读 · 0 评论 -
《MIC高性能计算编程指南》矩阵乘法源代码
《MIC高性能计算编程指南》矩阵乘法源代码,有需要的请下载了。点击打开链接原创 2013-08-06 09:20:38 · 2490 阅读 · 0 评论 -
天河二号横空出世,配4.8万块MIC计算卡
在德国莱比锡举行的2013年国际超级计算大会上,第41期全球超级计算机500强排行榜今天正式公布,中国的天河2号(Tianhe-2)成功登顶。这也是继2010年11月的天河1A夺魁之后,中国重返超算性能世界第一!(不过天河1A这次再次下滑两名,排到了第十)曾在5月份参观了天河2号系统的TOP500编辑Jack Dongarra表示,这套系统值得人们尊重。他说:“这套系统的大部分功能都是中国转载 2013-06-20 09:10:41 · 3298 阅读 · 1 评论 -
MIC编程(7 )——offload语法
MIC编程中最基本的语法就是offload语句,offload语句的作用为将程序和数据由CPU端传递到MIC端,并在MIC上执行,offload语法为:C/C++: #pragma offload target(mic: id) in(...) out(...)Fortran: !dec$ OFFLOAD target(mic: id) in(...) out(...)或原创 2013-05-25 15:09:38 · 6367 阅读 · 9 评论 -
MIC编程(8)——offload语句内调用的函数声明方式
利用offload模式在MIC卡上编程时,offload内调用的函数前必须加“__attribute__((target(mic))) ”,如:__attribute__((target(mic)))void VecAdd_mic(float* A, float* B, float* C, int size){#pragma omp parallel for原创 2013-05-25 15:13:05 · 2323 阅读 · 0 评论 -
MIC编程(5 )——MIC驱动MPSS安装
1 MIC对硬件的要求1) 主板目前,并不是所有的主板都支持MIC环境,有些主板升级BOIS后可以支持MIC环境。MIC需要在主板BOIS中启用大型基本地址寄存器 (BAR) 支持,MMIO大于4GB的寻址。默认情况下,大多数平台BIOS实施将其设为禁用,因此必须在平台 BIOS 设置中将其手动启用。有些系统默认的散热速度并未设置成全速,当使用被动散热的M原创 2013-05-24 21:34:35 · 13282 阅读 · 3 评论 -
MIC编程(4)——MIC灵活高效的编程方式
MIC是基于X86架构的众核处理器,CPU多核上的并行编程模型在MIC上都支持,同时MIC卡上运行一个uos,因此,MIC与CPU多核之间的编程很灵活,既可以CPU端启动主函数,也可以MIC端启动主函数,甚至可以CPU和MIC端同时各自发起主函数。CPU多核和MIC协同编程模式如下图所示,CPU多核和MIC协同计算有以下几种模式:1) Multi-Core Hosted:程序并行度原创 2013-05-24 20:59:41 · 5134 阅读 · 2 评论 -
MIC编程(2)——MIC主要参数
MIC 卡上每个核可以执行不同的指令,每个核最多支持4个硬件线程,用来隐藏存储访问延迟。MIC卡与主机端通过PCI-E连接,支持PCI-E x8或x16线宽配置。每个MIC卡可以设置独立的IP,可以把每个MIC卡当作独立的节点。MIC卡拥有512bit的向量位宽,可以同时处理16个32-bit浮点/整形元素或8个64-bit浮点/整形元素的计算。MIC卡包含32KB L1指令cac原创 2013-05-24 20:38:43 · 3939 阅读 · 0 评论 -
MIC编程(6 )——MIC对等模式配置方法
基于InfiniBand网络的的对等模式还没有配置成功过,下面以以太网的配置方法为例说明其过程。首先安装MIC驱动-MPSS包,详细安装过程见“MIC编程(5 )——MIC驱动MPSS安装”通过service mpss status命令查看mpss的运行状态,若返回mpss is running,则先关闭mpss服务:service mpss stop下面以host原创 2013-05-24 21:48:50 · 3012 阅读 · 0 评论 -
高性能计算知识汇总
高性能计算各方面知识汇总:高性能计算中用到的测试程序、存储系统、网络系统、集群管理系统、并行开发环境、并行开发策略、容错等转载 2016-01-26 12:54:30 · 1887 阅读 · 0 评论