简介
本博客针对MachSuite收录的部分计算密集,有较大加速潜力的子集进行数据并行和数据重用分析,具体分析见列表中博客。
实验设备:
Intel i5 3250 cpu双核, 4GB DDR3, ubuntu18.04
分析思路
#热点分析
##热点函数
##热点循环
#功能分析
##数据标签
##数据流分析
#DLP分析
##可并行性
##并行模式
#Date Reuse分析
##重用机会
分析列表
Benchmark分析2: MachSuite.gemm.blocked
Benchmark分析2: MachSuite.gemm.ncubed
Benchmark分析2: MachSuite.viterbi
Benchmark分析2: MachSuite.spmv.crs
Benchmark分析2: MachSuite.stencil.stencil2d