优化程序的方法
优化程序性能直白将怎么让程序运行的更快!
如何让程序跑的更快一点?
有三个途径:
1.选择合适的算法喝数据结构;
2.编译器容易优化代码;
3.探索并行化;
妨碍优化因素
这里主要说说一些典型的阻碍优化的因素,包括内存别名使用和过程调用。
编译器具有优化源码的能力,可能会利用机会减少程序执行的次数。
防止一些缺陷:
1.内存别名的使用,指针指向同一内存地址;
2.函数调用;
实例1.
void fun1(long *xp, long *yp){
*xp += *yp;
*xp += *yp;
}
void fun2(long *xp, long *yp){
*xp += 2* *yp;
}
由于fun1需要6次内存引用(2次读xp,2次读yp,2次写xp),而fun2只有3次(读xp读yp写xp),所以编译器基于func2能产生更有效代码。
但是当xp和yp指向同一个内存地址时,就出现问题了。fun1结果是xp变为原来的4倍,而fun2结果是xp变为原来的3倍,此时明显fun2不是fun1优化版本。
实例2
long counter = 0;
long f(){
return counter++;
}
long fun1(){
return f()+f()+f()+f();
}
long fun2(){
renturn 4*f();
}
咋一看,fun2只调用1次f(),而fun1 要调用4次,fun2似乎可以作为fun1的优化版本,但是仔细分析,fun1返回值是0+1+2+3=6,fun2返回值是4*0=0.
到此,我们发现程序员必须对消除这些妨碍优化的因素负主要责任,这些都应该被视为良好编程习惯的一部分。
处理器体系结构
除了上述的基本级别的调整性能外,还有一系列技术,包括循环展开、创建多个累计变量和重新组合,都是基于现代处理器提供的指令级并行技术。
这里简单了解一下处理器体系结构:
由于现代处理器能够在一个时钟周期内执行多个操作,且指令执行顺序不一定和在机器级程序的顺序一致。
整体分为两个部分:指令控制单元和执行单元。