虽然,这些使用方法看似差别不大,在现在的cpu运行期起来几乎上可以忽略不计,
但是,我们想一下现在软件,每一个都是那么的庞大,一个小项目都是几万行代码,
一个函数中你消耗一点,那么多函数是很大的性能消耗的。举一个不恰当的例子,
如果在百度首页中,每天几亿次的点击率,每一个函数里面都有一个无用++运算,这个i++可以小视吗?
下面的例子是我在虚拟机中运行,其中也会有机器性能不好的原因,但是我觉得这样才会将问题展示的更加的严重。
1.不要将函数作为循环的条件
SIZE= 1024
program 1: time:29ms
p = &a;
for( ; i < SIZE *sizeof(int); i++)
{
p = 1;
p++;
}
program 2:
time:1ms
p = &a;
len = SIZE *sizeof(int);
for( ; i < len; i++)
{
p = 1;
p++;
}
原因:因为每次比较条件,函数都需要重新计算的,将会消耗时间。
2. 减少内存访问次数
program:1 time:1ms
i = 0;
for( ; i < 1024; i++)
for( ; i < 1024; i++)
tmp ++;
program:2 time:7ms
i = 0;
for( ; i < 1024; i++)
tmp = tmp + 1;
原因:内存与cpu的频率差别很大,尽量减少cpu对内存的访问,减少变量引用;
3.去除不必要的分支
program:1 time:3ms
i = 0;
for (tmp = 0; tmp < 100; tmp++)
{
max = min = a[0] ;
for( ; i < 100; i++)
{
if (max > a[i]) max = a[i];
if (min < a[i]) min = a[i];
}
}
program:2 time:2ms
i = 0;
for (tmp = 0; tmp < 100; tmp++)
{
max = min = a[0] ;
for( ; i < 100; i++)
{
if (max > a[i]) max = a[i];
else if (min < a[i]) min = a[i];
}
}
注意:这个平时写代码的时候注意方可,很多时候书上都是这样的写的,大家觉得没什么?不影响程序的运行结果。所以,没有注意。
4.间接寻址比基地址寻址慢,所以将结构体中常用的成员放前面,并且放在一起。(类、接口、文件同理)
program 1: time:11ms
i = 0;
for( ; i < 1000; i++)
{
t.t1 = 1;
t.t3 = 1;
}
program 1: time:7ms
i = 0;
for( ; i < 1000; i++)
{
t.t1 = 1;
t.t2 = 1;
}
原因:将数据放到同一内存页中,减少页面切换,增加缓存的命中率。