Nontemporal store调研分析
目录:
我们为什么要研究Nontemporal指令?
我们的目的是什么?
Nontemporal指令是什么?
Nontemporal指令的作用是什么?
Nontemporal指令现在的应用有哪些热度如何?
Nontemporal指令怎么用?
Nontemporal指令有哪些?
Nontemporal指令在gcc中支持情况如何?
如何在gcc中优化是它在恰当的时候生成nontemporal指令?
我们为什么要研究Nontemporal指令?
在跑stream的时候,icc与gcc跑分差别一个主要的原因是icc应用nontemporal store指令,而gcc只是应用通用的store指令,造成了性能的差别,如图:
2.gcc-par
-------------------------------------------------------------
Function Best Rate MB/s Avg time Min time Max time
Copy: 7562.6 0.021484 0.021157 0.022475
Scale: 3376.5 0.050597 0.047386 0.058281
Add: 3647.5 0.068446 0.065799 0.071843
Triad: 3638.6 0.069281 0.065960 0.073468
5. icc-par
-------------------------------------------------------------
Function Best Rate MB/s Avg time Min time Max time
Copy: 7449.1 0.022009 0.021479 0.024897
Scale: 5663.9 0.031585 0.028249 0.038350
Add: 5550.3 0.048144 0.043241 0.057525