提高算法性能最主要的手段是提高渐进复杂度,从一个O(n^2)的算法改进到O(nlogn)的算法可以带来巨大的性能提升。然而,在许多情况下,我们需要对多个复杂度在渐进意义上相等的算法进行比较,这时就要对算法复杂度的所谓“常数项”进行分析了。著名的快速排序算法之所以在众O(nlogn)算法中脱颖而出成为“快速”排序,其中一部分要归功于连续的内存读取节省了CPU在IO上的开销(因而优于堆排序),另一部分就要归功于它尽可能少地做了“无用”的交换或者复制(因而优于归并排序),从而减少了算法渐进复杂度的常数项。
进行常数项的分析的实际前提是对各种程序语句的相对开销有基本的了解。因为C++应用广泛且和底层硬件有较强的关联,容易“翻译”为汇编语言和机器语言,这里以实验为基础,研究C++中各种基本语句的相对时间开销。代码如下:
#include <iostream>
#include <ctime>
#include <cstdlib>
using namespace std;
int main()
{
clock_t t=clock();
for(int i=0;i<300;i++){
for(int j=0;j<300;j++){
for(int k=0;k<300;k++){
}
}
}
t=clock()-t;
cout<<"Time cost for empty cycle: "<<(float(t)/CLOCKS_PER_SEC)<<" sec"<<endl;
int n=0;
t=clock();
for(int i=0;i<300;i++){
for(int j=0;j<300;j++){
for(int k=0;k<300;k++){
n++;
}
}
}
t=clock()-t;
cout<<"Time cost for integer inc: "<<(float(t)/CLOCKS_PER_SEC)<<" sec"<<endl;
n=2;
t=clock();
for(int i=0;i<300;i++){
for(int j=0;j<300;j++){
for(int k=0;k<300;k++){
n*