1.热点分析
1.1热点函数
1.2热点循环
格式说明: 热点循环-(函数执行次数-各层执行总次数)
执行百分比:热点循环占本函数执行比例
函数: Kernel::dot
Kd.L1(531434-8285056060)
执行百分比:(待VTune结果)
1.3 热点代码
/* 函数 Kernel::dot */
// Kd.L1
for (int i = 0; i < nGeneLength; i++)
{
// P1
sum += px->value * py->value;
px ++;
py ++;
}
2.功能分析
2.1数据标签
标签 | 数据 | 注释 |
---|---|---|
Kd.v1 | px->value | 结构体指针 |
Kd.v2 | py->value | 结构体指针 |
Kd.s1 | sum | 标量 |
说明:s,v,m,t(全局数据)Kd-(局部数据)
2.2数据流分析
函数 Kernel::dot
Kd.L1(6行)
P1: (Kd.v1, Kd.v2), Kd.s1 -> Kd.s1;加法树
3.加速分析