C++程序性能优化

EverthingCool

已于 2024-05-16 16:32:09 修改

阅读量117

点赞数 3

分类专栏： C++ 文章标签： c++ 开发语言

于 2024-05-16 15:42:03 首次发布

本文链接：https://blog.csdn.net/qq_37680787/article/details/138963894

版权

C++ 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1、使用++i,而不是使用i++
说明：在迭代器进行遍历时，如果使用i++,会先构造一个对象返回，然后使迭代器指向下一个，而++i是直接返回迭代器指向的下一个

2、函数参数使用引用传递
说明：使用值传递，会有构造、析构函数的调用

3、尽量少使用多重继承
说明：关系复杂

4、尽量少使用dynamic_cast

5、小粒度函数声明为内联函数（inline）

正如我们所知，调用函数是需要保护现场，为局部变量分配内存，函数结束后还要恢复现场等开销，而内联函数则是把它的代码直接写到调用函数处，所以不需要这些开销，但会使程序的源代码长度变大。

6、多用直接初始化

ClassTest ct1; 
//直接初始化：只会调用构造函数     
ClassTest ct2(ct1);   
 //复制初始化：会调用赋值函数  
ClassTest ct3 = ct1;

以下是Primer是的原话：

“当用于类类型对象时，初始化的复制形式和直接形式有所不同：直接初始化直接调用与实参匹配的构造函数，复制初始化总是调用复制构造函数。复制初始化首先使用指定构造函数创建一个临时对象，然后用复制构造函数将那个临时对象复制到正在创建的对象”，还有一段这样说，“通常直接初始化和复制初始化仅在低级别优化上存在差异，然而，对于不支持复制的类型，或者使用非explicit构造函数的时候，它们有本质区别：
ifstream file1("filename")://ok:direct initialization
ifstream file2 = "filename";//error:copy constructor is private

7、对于代码1和代码2的效率运行情况根据实际情况而定

注：这里的fun1()和fun2()是没有关联的，即两段代码所产生的结果是一样的。

  for(int i =0;i<n;++i)
{
    fun1();
    fun2();
}

  for(int i =0;i<n;++i)
{
    fun1();
}

 for(int i =0;i<n;++i)
{
    fun2();
}

说明：这就要看fun1和fun2这两个函数的规模（或复杂性）了，如果这多个函数的代码语句很少，则代码1的运行效率高一些，但是若fun1和fun2的语句有很多，规模较大，则代码2的运行效率会比代码1显著高得多。

由于CPU只能从内存在读取数据，而CPU的运算速度远远大于内存，所以为了提高程序的运行速度有效地利用CPU的能力，在内存与CPU之间有一个叫Cache的存储器，它的速度接近CPU。而Cache中的数据是从内存中加载而来的，这个过程需要访问内存，速度较慢。

这里先说说Cache的设计原理，就是时间局部性和空间局部性。时间局部性是指如果一个存储单元被访问，则可能该单元会很快被再次访问，这是因为程序存在着循环。空间局部性是指如果一个储存单元被访问，则该单元邻近的单元也可能很快被访问，这是因为程序中大部分指令是顺序存储、顺序执行的，数据也一般也是以向量、数组、树、表等形式簇聚在一起的。

如果fun1和fun2的代码量很大，例如都大于Cache的容量，则在代码1中，就不能充分利用Cache了（由时间局部性和空间局部性可知），因为每循环一次，都要把Cache中的内容踢出，重新从内存中加载另一个函数的代码指令和数据，而代码2则更很好地利用了Cache，利用两个循环语句，每个循环所用到的数据几乎都已加载到Cache中，每次循环都可从Cache中读写数据，访问内存较少，速度较快，理论上来说只需要完全踢出fun1的数据1次即可。

8、对于代码1和代码2的效率运行情况根据具体对象的复杂性而定

ClassTest test;
for(int i=0;i<n;++i)
{
    test=a;
    //TODO
}

for(int i=0;i<n;++i)
{
    ClassTest test=a;
    //TODO
}

上述那段代码的效率更高是不确定的，或者说是由这个类ClassTest决定的，分析如下：

对于代码1：需要调用ClassTest的构造函数1次，赋值操作函数（operator=）n次；对于代码2：需要高用（复制）构造函数100次，析构函数100次。

如果调用赋值操作函数的开销比调用构造函数和析构函数的总开销小，则第一种效率高，否则第二种的效率高。

9、减少除法运算的使用

无论是整数还是浮点数运算，除法都是一件运算速度很慢的指令，在计算机中实现除法是比较复杂的。所以要减少除法运算的次数，下面介绍一些简单方法来提高效率：
1、通过数学的方法，把除法变为乘法运算，如if(a > b/c),如果a、b、c都是正数，则可写成if(a*c > b)
2、让编译器有优化的余地，如里你要做的运算是int型的n/8的话，写成（unsigned)n/8有利于编译器的优化。而要让编译器有优化的余地，则除数必须为常数，而这也可以用const修饰一个变量来达到目的。

10、局部变量VS静态变量

很多人认为局部变量在使用到时才会在内存中分配储存单元，而静态变量在程序的一开始便存在于内存中，所以使用静态变量的效率应该比局部变量高，其实这是一个误区，使用局部变量的效率比使用静态变量要高。

这是因为局部变量是存在于堆栈中的，对其空间的分配仅仅是修改一次esp寄存器的内容即可（即使定义一组局部变量也是修改一次）。而局部变量存在于堆栈中最大的好处是，函数能重复使用内存，当一个函数调用完毕时，退出程序堆栈，内存空间被回收，当新的函数被调用时，局部变量又可以重新使用相同的地址。当一块数据被反复读写，其数据会留在CPU的一级缓存（Cache）中，访问速度非常快。而静态变量却不存在于堆栈中。

可以说静态变量是低效的。