最近有一个超大计算量的程序要优化一下速度,毕竟对于大数据计算来说,速度也是一个很重要的用户体验要素。
............. N 多实验 ...........
某次实验是减少 汇编 指令条数,对于 C 代码有两种写法
C 写法一:
对应生成的汇编指令是 各种 shl add shl add shl add,这是 gcc 生成的神奇指令,总之这一顿操作后 row 就偏移了 584 个字节。
time 命令看到实现程序的执行时间
C 写法二,思路是减少 gcc 生成的 多条 shl add ... 的指令,用一条 乘法指令代替