自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(62)
  • 收藏
  • 关注

原创 Benchmark分析7:SPEC2006.458sjeng

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: quantum_toffoliqt.L1.1.1(65036-)执行百分比:99.0%函数: quantum_sigma_xqs.L1.1(23501-)执行百分比:100%函数: quantum_cnotqc.L1.1.1(13315-)执行百分比:100%1.3 热点代码/* 函数 quantum_toffoli */// qt.

2020-12-24 22:48:27 250

原创 Benchmark分析7:SPEC2006.464h264ref

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: quantum_toffoliqt.L1.1.1(65036-)执行百分比:99.0%函数: quantum_sigma_xqs.L1.1(23501-)执行百分比:100%函数: quantum_cnotqc.L1.1.1(13315-)执行百分比:100%1.3 热点代码/* 函数 quantum_toffoli */// qt.

2020-12-24 22:41:08 232

原创 Benchmark分析7:SPEC2006.445gobmk

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数:primal_bea_mpppb.L1.1(80-102400-98304000)执行百分比:99.0%函数: refresh_potentialrp.L1.1(80-77040-98919360)执行百分比:18.2%函数: price_out_implpo.L1.1(80-77120-98752160)执行百分比:100%函数: repla

2020-12-24 22:37:29 260

原创 Benchmark Analysis 7:SPEC2006.433milc

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-各层执行总次数执行百分比:热点循环占本函数执行比例函数: mgau_evalme.L1.1.1 (64-170360-485696360-122074790)执行百分比:93.5%函数: vector_gautbl_eval_logs3vg.L1.1.1.1 (91264-912640-9126400-45632000-228160000)执行百分比:86.7%函数: subvq_mgau_shortlistsm.L1.

2020-12-24 22:33:45 300

原创 Benchmark分析7:SPEC2006

简介本博客针对MachSuite收录的部分计算密集,有较大加速潜力的子集进行数据并行和数据重用分析,具体分析见列表中博客。实验设备:Intel i5 3250 cpu双核, 4GB DDR3, ubuntu18.04分析思路#热点分析##热点函数##热点循环#功能分析##数据标签##数据流分析#DLP分析##可并行性##并行模式#Date Reuse分析##重用机会分析列表Benchmark分析7: MachSuite.gemm.blockedBenchmark分析2:

2020-12-20 18:05:47 469 1

原创 Benchmark Analysis 7:SPEC2006.462libquantum

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: finalSADfS.L1.1(80-102400-98304000)执行百分比:99.0%函数: integralImage2D2DiI.L1.1(80-77040-98919360)执行百分比:18.2%iI.L2.1(80-77120-98944960)执行百分比:71%函数: computeSADcS.L1.1(80-77120-98

2020-12-20 18:03:18 358

原创 Benchmark Analysis 7:SPEC2006.429mcf

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: finalSADfS.L1.1(80-102400-98304000)执行百分比:99.0%函数: integralImage2D2DiI.L1.1(80-77040-98919360)执行百分比:18.2%iI.L2.1(80-77120-98944960)执行百分比:71%函数: computeSADcS.L1.1(80-77120-98

2020-12-20 18:01:32 431

原创 Benchmark分析7:SPEC2006.401bzip2

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: finalSADfS.L1.1(80-102400-98304000)执行百分比:99.0%函数: integralImage2D2DiI.L1.1(80-77040-98919360)执行百分比:18.2%iI.L2.1(80-77120-98944960)执行百分比:71%函数: computeSADcS.L1.1(80-77120-98

2020-12-20 17:59:45 240

原创 Benchmark分析6: Xloop

简介本博客针对Cortexsuite收录的计算机视觉算法进行数据并行和数据重用分析,具体分析见列表中博客。实验设备:Intel® Xeon® CPU E5-2609 0 @ 2.40GHz 8Vcpu, 54.83GiB, CentOx7Intel i5 3250 cpu双核, 4GB DDR3, ubuntu18.04分析思路#热点分析##热点函数##热点循环#功能分析##数据标签##数据流分析#DLP分析##可并行性##并行模式#Date Reuse分析##重用机会分

2020-12-16 11:47:06 206

原创 Benchmark分析6:Xloop.covariance

1.热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: covariance_scalar_intco.L1.1执行百分比:0.5%co.L2.1执行百分比:0.7%co.L3.1执行百分比:98.2%2. 热点代码/* 函数 covariance_scalar_int */// co.L1for (j = 0; j < M; j++) { for (i = 0; i < N; i++) {

2020-12-16 11:44:26 100

原创 Benchmark分析6:Xloop.mvt

1.热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: mvt_intmv.L1.1执行百分比:36.7%mv.L2.1执行百分比:36.7%2. 热点代码/* 函数 mvt_int */// mv.L1for (i = 0; i < _PB_N; i++) { //mv.L1.1 for (j = 0; j < _PB_N; j++) { x1[i] = x1[i] + A[i]

2020-12-16 11:37:52 131

原创 Benchmark Analysis 7:SPEC2006.482sphinx

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-各层执行总次数执行百分比:热点循环占本函数执行比例函数: medianme.L1.1.1 (64-170360-485696360-122074790)执行百分比:93.5%函数: FullSearchFu.L1.1.1.1 (91264-912640-9126400-45632000-228160000)执行百分比:86.7%1.3 热点代码/* median */// me.L1for (i = 1; (

2020-12-13 17:06:24 229

原创 Benchmark分析5:Cortexsuite.vision.texture

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: initin.L1.1.1.1(10000-110000-5440000-296960000-4658560000)执行百分比:86.9%1.3 热点代码/* 函数 init */// in.L1for(i=0;i<data->heightout;i++){ for(j=0;j<data->widthout;j++)

2020-07-22 22:49:26 77

原创 Benchmark分析5:Cortexsuite.vision.stitch

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: fDeepcopyfD.L1.1(10000-110000-5440000-296960000-4658560000)执行百分比:100%1.3 热点代码/* 函数 imsmooth */// fD.L1for(i=0; i<rows; i++){ // fD.L1.1 for(j=0; j<cols; j++) {

2020-07-22 22:44:10 77

原创 MicroBenchmarks:ld1-sd1

例子汇总例1 (i>j):不可并行int main(){ 10182: 7139 addi sp,sp,-64 10184: fc06 sd ra,56(sp) 10186: 003c addi a5,sp,8 10188: 1810 addi a2,sp,48 int i, A[10]; for(i = 0; i < 10; i++

2020-07-02 21:48:40 295

原创 Benchmark分析5:Cortexsuite.vision.tracking

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: stencil3dst.L1.1.1(1000000-30000000-900000000-12600000000)执行百分比:88.7%1.3 热点代码/* 函数 stencil3d */// st.L1for(i = 1; i < height_size - 1; i++){ for(j = 1; j < col_size

2020-06-19 17:54:47 161

原创 Benchmark分析5:Cortexsuite.vision.sift

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: stencil3dst.L1.1.1(1000000-30000000-900000000-12600000000)执行百分比:88.7%1.3 热点代码/* 函数 stencil3d */// st.L1for(i = 1; i < height_size - 1; i++){ for(j = 1; j < col_size

2020-06-19 17:53:39 127

原创 Benchmark分析5:Cortexsuite.vision.multi_ncut

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: stencil3dst.L1.1.1(1000000-30000000-900000000-12600000000)执行百分比:88.7%1.3 热点代码/* 函数 stencil3d */// st.L1for(i = 1; i < height_size - 1; i++){ for(j = 1; j < col_size

2020-06-19 17:53:13 138

原创 Benchmark分析5:Cortexsuite.vision.mser

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: stencil3dst.L1.1.1(1000000-30000000-900000000-12600000000)执行百分比:88.7%1.3 热点代码/* 函数 stencil3d */// st.L1for(i = 1; i < height_size - 1; i++){ for(j = 1; j < col_size

2020-06-19 17:52:09 111

原创 Benchmark分析5:Cortexsuite.vision.disparity

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: stencil3dst.L1.1.1(1000000-30000000-900000000-12600000000)执行百分比:88.7%1.3 热点代码/* 函数 stencil3d */// st.L1for(i = 1; i < height_size - 1; i++){ for(j = 1; j < col_size

2020-06-19 17:51:43 125

原创 Benchmark分析5:Cortexsuite.vision

简介本博客针对Cortexsuite收录的计算机视觉算法进行数据并行和数据重用分析,具体分析见列表中博客。实验设备:Intel® Xeon® CPU E5-2609 0 @ 2.40GHz 8Vcpu, 54.83GiB, CentOx7Intel i5 3250 cpu双核, 4GB DDR3, ubuntu18.04分析思路#热点分析##热点函数##热点循环#功能分析##数据标签##数据流分析#DLP分析##可并行性##并行模式#Date Reuse分析##重用机会分

2020-06-19 17:34:28 191

原创 Benchmark分析2: MachSuite.nw

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: needwunnw.L1.1(1000000-128000000-16384000000)执行百分比:76.7%nw.L1.1.1(1000000-128000000-16384000000-4576000000)执行百分比:1,2合计 10%nw.L1.1.2(1000000-128000000-16384000000-11808000000)n

2020-06-09 16:12:36 252

原创 Benchmark分析2: MachSuite.gemm.ncubed

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: gemmge.L1.1(1000000-64000000-4096000000)执行百分比:65.5%ge.L1.1.1(1000000-64000000-4096000000-262144000000)执行百分比:33.2%1.3 热点代码/* 函数 gemm */// ge.L1for(i=0;i<row_size;i++)

2020-06-01 16:44:41 276

原创 HASSA代码分析常例(更新)

通过大量Benchmark集的分析,提取以下较为常见的例子。暂时总结一般性结论:1.加法树计算运用较为普遍2.有较多认知错觉,以为计算密集的算法并非如此:如密码算法,财务计算模型,网页搜索,跟踪算法等3. if-else循环运用较多4. 循环指令并行性分析能够覆盖大多数代码分析;有相关性的情况:迭代间自相关最多,接着迭代内相关,接着迭代间他相关1. MachSuite.viterbiBenchmark分析2: MachSuite.viterbi/* 函数 viterbi *///

2020-05-22 11:55:27 344

原创 Benchmark分析[4]: parsec.ferret(备:结构体数据)

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例注意:由于emd与image_read_rgb_hsv函数无for循环,本文章仅分析热点函数image_segment函数: image_segmentsp.L1.1(1-494-1666)执行百分比:76.8%1.3 热点代码/* 函数 im...

2020-05-18 18:00:26 221

原创 Benchmark分析[4]: parsec.fluidanimate(备)

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例注意:由于emd与image_read_rgb_hsv函数无for循环,本文章仅分析热点函数image_segment函数: image_segmentsp.L1.1(1-494-1666)执行百分比:76.8%1.3 热点代码/* 函数 Co...

2020-05-18 17:58:10 186

原创 Benchmark分析[4]: parsec.cannel(备)

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: netlist_elem::swap_costns.L1(180000000-778566410)执行百分比:ns.L1(180000000-778588380)执行百分比:1.3 热点代码/* 函数 netlist_elem::swap_cost */// ns.L1for (int i = 0; i< fanin.size();

2020-05-18 17:53:51 233

原创 Benchmark分析[4]: parsec.splash2x.water_nsquared(三维)

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: INITIAIN.L1.1.1.1(1-100-10000-1000000-3000000)执行百分比:IN.L2.1.1(1-1000000-3000000-15000000)执行百分比:IN.L3(1-1000000)执行百分比:IN.L4.1(1-1000000-3000000)执行百分比:1.3 热点代码/* 函数 INITIA

2020-05-18 17:50:04 183

原创 Benchmark分析[4]: parsec.dedup

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: rabinsegra.L1(369317-692397835)执行百分比:1.3 热点代码/* 函数 netlist_elem::swap_cost *//*for(i=0; i<NWINDOW; i++){ x = h >> 24; h = (h<<8)|p[i]; h ^= rabintab

2020-05-18 15:48:16 248

原创 Benchmark分析2: MachSuite.fft.strided

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: fftfft.L1.1.1(1000000-10000000-5120000000-4097000000)执行百分比:100%1.3 热点代码/* 函数 fft */// ff.L1for(span=FFT_SIZE>>1; span; span>>=1, log++){ // ff.L1.1 for(odd=

2020-05-18 15:27:12 191

原创 Benchmark分析[4]: parsec.splash2-2x.lu_cb-lu_ncb

简介Black-Scholes方程是一个微分方程,描述了在特定的一组假设下,期权的价值如何随着基础资产价格的变化而变化。本并行化算法:只需定价使用Black-Scholes公式并行选择多个选项; 每个线程为单个选项定价。1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: spmvsp.L1.1...

2020-05-17 16:06:50 359 1

原创 Benchmark分析[4]: parsec

简介The Princeton Application Repository for Shared-Memory Computers (PARSEC)是一个可以用于多核机器性能研究的并行程序集合。本博客针对PARSEC收录的部分计算密集,有较大加速潜力的子集进行数据并行和数据重用分析,具体分析见列表中博客。实验设备:Intel® Xeon® CPU E5-2609 0 @ 2.40GHz ...

2020-05-13 19:00:52 629

原创 Benchmark分析[4]: parsec.splash2.ocean_cp(备)

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: rabinsegra.L1(369317-692397835)执行百分比:1.3 热点代码/* 函数 netlist_elem::swap_cost *//*for(i=0; i<NWINDOW; i++){ x = h >> 24; h = (h<<8)|p[i]; h ^= rabintab

2020-05-13 18:54:43 215

原创 Benchmark分析[4]: parsec.swaption

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: distdi.L1(1610802174-206182678272)执行百分比:95.91%1.3 热点代码/* 函数 dist *///di.L1 for(int b=0; b<BLOCKSIZE; b++){ ...

2020-05-02 19:32:13 252

原创 Benchmark分析[4]: parsec.streamcluster

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: distdi.L1(1610802174-206182678272)执行百分比:95.91%1.3 热点代码/* 函数 dist *///di.L1for (i=0;i<dim;i++){ // P1 result += ...

2020-04-30 11:24:18 508

原创 Benchmark分析2: MachSuite.stencil.stencil3d

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: bbgemmTh.L1.1.1.1.1.1(1-7078000-7078000-7078000-184028000-36789233000)执行百分比:37.2%Th.L1.1.1.1.1.2(1-7078000-7078000-7078000...

2020-03-11 23:19:22 163

原创 Benchmark分析2: MachSuite.spmv.crs

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: bbgemmTh.L1.1.1.1.1.1(1-7078000-7078000-7078000-184028000-36789233000)执行百分比:37.2%Th.L1.1.1.1.1.2(1-7078000-7078000-7078000...

2020-03-11 23:02:46 224

原创 Benchmark分析[3]: MineBench.Hop

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: smBallSearchsBS.L1.1.1(40-9292090-89623610-559127960)执行百分比:(待VTune结果)函数:smBallGathersBG.L1.1.1(40-9292090-89623610-559127...

2020-03-11 22:45:15 273

原创 Benchmark分析[3]: MineBench.RSEARCH

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: CYKScanCY.L1.1.1(40-9292090-89623610-559127960)执行百分比:(待VTune结果)1.3 热点代码/* 函数 Entry::operator| */// Eo.L1{ d=(v2.n*...

2020-03-10 23:15:27 146

原创 Benchmark分析[3]: MineBench.ScalParc

1.热点分析1.1热点函数1.2热点循环格式说明: 热点循环-(函数执行次数-各层执行总次数)执行百分比:热点循环占本函数执行比例函数: euclid_dist_2sBS.L1.1.1(40-9292090-89623610-559127960)执行百分比:(待VTune结果)函数: find_nearest_pointsBG.L1.1.1(40-9292090-8962361...

2020-03-10 22:30:57 105

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除