intel和amd对java_如何在AMD芯片上使用intel编译器优化C程序

新手在这里 . 我有一个很大的有限分析代码需要运行高性能计算 . 人们一直告诉我英特尔编译器通常会提供更好的速度(我之前使用过gcc) . 我发现在我们的英特尔集群上也是如此 . 但最近我们有一个新的AMD集群 . 我对如何使用 icpc 的编译选项来优化程序感到困惑 .

基本上,我有两个问题:

问题1

以下是采用AMD芯片的集群:

processor : 63

vendor_id : AuthenticAMD

cpu family : 21

model : 2

model name : AMD Opteron(tm) Processor 6378

stepping : 0

cpu MHz : 2399.837

cache size : 2048 KB

physical id : 2

siblings : 16

core id : 7

cpu cores : 8

apicid : 79

initial apicid : 79

fpu : yes

fpu_exception : yes

cpuid level : 13

wp : yes

flags : fpu vme de pse tsc msr pae mce cx8 apic mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm constant_tsc rep_good nonstop_tsc extd_apicid amd_dcm aperfmperf pni pclmulqdq monitor ssse3 fma cx16 sse4_1 sse4_2 popcnt aes xsave avx f16c lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs xop skinit wdt lwp fma4 nodeid_msr tbm topoext perfctr_core cpb npt lbrv svm_lock nrip_save tsc_scale vmcb_clean flushbyasid decodeassists pausefilter pfthreshold

bogomips : 4799.73

TLB size : 1536 4K pages

clflush size : 64

cache_alignment : 64

address sizes : 48 bits physical, 48 bits virtual

power management: ts ttp tm 100mhzsteps hwpstate [9] [10]

当我使用 icpc hello.cpp -O3 -xP 编译一个小代码时,我不确切知道应该使用哪些选项?我发现错误是:

$ /usr/bin/time -p ./a.out

Fatal Error: This program was not built to run on the processor in your system.

The allowed processors are: Intel(R) Pentium(R) 4 and compatible Intel processors with Intel(R) Streaming SIMD Extensions 3 (Intel(R) SSE3) instruction support.

real 0.00

user 0.00

sys 0.00

问题-2

如果我想将二进制文件用于英特尔芯片集群和AMD芯片集群,我应该使用不同的选项来编译代码吗?

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值