提高c++性能的编程技术 pdf_《提高C++性能的编程技术》笔记-第11章

11.标准模板库

1. 标准模板库(STL)是容器和通用算法的强效结合。但是从性能的角度出发,我们要考虑以下问题:

(1). 在渐近复杂度方面,STL与各种容器和算法的性能密切相关。这是什么意思?

(2). STL是由很多容器组成的,对于一个具体的计算任务(例如排序、插入、删除、遍历、查找等),应该使用哪种容器比较好,为什么?另外,在特定的条件下还有更好的选择吗?

(3). STL的性能如何?如果更好的使用自定义的容器和算法?

2. 插入测试

案例:

#include <iostream>
#include <stdlib.h>
#include <windows.h>
#include <algorithm>
#include <vector>
#include <list>
#include <set>

static LARGE_INTEGER cpuFreq;
static LARGE_INTEGER startTime;
static LARGE_INTEGER endTime;
static double run_time = 0.0;

using namespace std;

/*目的:测试不同容器,插入数据的性能*/
/*测试要求:将100万个随机元素插入到数组、向量、列表和多重集中。每个插入测试带有三个参数
     1.指向被测目标容器的指针。
     2.指向data数组的指针,该数组保存了要插入到目标容器的元素。
     3.data数组的大小。
*/

//数组形式插入
template <class T>
void arrayInsert(T *a, const T *collection, int size)
{
    for(int k = 0; k < size; k++){
        a[k] = collection[k];
    }
}

//向量形式插入
template <class T>
void vectorInsert(vector<T> *v, const T *collection, int size)
{
    for(int k = 0; k < size; k++){
       v->push_back(collection[k]);
    }
}

//向量形式插入容器前端
template <class T>
void vectorInsertFront(vector<T> *v, const T *collection, int size)
{
    for(int k = 0; k < size; k++){
       v->insert(v->begin(), collection[k]);
    }
}

//列表形式插入
template <class T>
void listInsert(list<T> *l, const T *collection, int size)
{
    for(int k = 0; k < size; k++){
       l->push_back(collection[k]);
    }
}

//列表形式插入容器前端
template <class T>
void listInsertFront(list<T> *l, const T *collection, int size)
{
    for(int k = 0; k < size; k++){
       l->push_front(collection[k]);
    }
}

//多重集中形式插入
template <class T>
void multisetInsert(multiset<T> *s,const T *collection, int size)
{
    for(int k = 0; k < size; k++){
       s->insert(collection[k]);
    }
}

//产生随机元素函数
int *genInitData(int size)
{
    int *data = new int[size];
    generate(&data[0], &data[size],rand);
    return data;
}

//各个容器插入性能对比
void Insert_Perfor()
{
    QueryPerformanceFrequency(&cpuFreq);  //获取系统时钟的频率
    const int size = 1000000;
    //int array_data[1000000] = {0};  //直接分配的int类型数组在栈空间上的大小有限。有问题
    int *data = genInitData(size);
    int *array_data = new int[size];
    QueryPerformanceCounter(&startTime);
    arrayInsert(array_data,data,size);
    QueryPerformanceCounter(&endTime);

    run_time = (((endTime.QuadPart - startTime.QuadPart) * 1000.0) / cpuFreq.QuadPart);
    cout << "arrayInsert run_time: "<< run_time <<"ms" << endl;

    vector<int> vec_data;
    QueryPerformanceCounter(&startTime);
    vectorInsert(&vec_data,data,size);
    QueryPerformanceCounter(&endTime);
    run_time = (((endTime.QuadPart - startTime.QuadPart) * 1000.0) / cpuFreq.QuadPart);
    cout << "vectorInsert run_time: "<< run_time <<"ms" << endl;

    list<int> list_data;
    QueryPerformanceCounter(&startTime);
    listInsert(&list_data,data,size);
    QueryPerformanceCounter(&endTime);
    run_time = (((endTime.QuadPart - startTime.QuadPart) * 1000.0) / cpuFreq.QuadPart);
    cout << "listInsert run_time: "<< run_time <<"ms" << endl;

    multiset<int> multiset_data;
    QueryPerformanceCounter(&startTime);
    multisetInsert(&multiset_data,data,size);
    QueryPerformanceCounter(&endTime);
    run_time = (((endTime.QuadPart - startTime.QuadPart) * 1000.0) / cpuFreq.QuadPart);
    cout << "multisetInsert run_time: "<< run_time <<"ms" << endl;
}

//向量和列表插入容器前端性能对比
void Insert_Front_Perfor()
{
    QueryPerformanceFrequency(&cpuFreq);  //获取系统时钟的频率
    const int size_front = 100000;
    int *data_front = genInitData(size_front);
    vector<int> vec_front_data;
    QueryPerformanceCounter(&startTime);
    vectorInsertFront(&vec_front_data,data_front,size_front);
    QueryPerformanceCounter(&endTime);
    run_time = (((endTime.QuadPart - startTime.QuadPart) * 1000.0) / cpuFreq.QuadPart);
    cout << "vectorInsertFront run_time: "<< run_time <<"ms" << endl;

    list<int> list_front_data;
    QueryPerformanceCounter(&startTime);
    listInsertFront(&list_front_data,data_front,size_front);
    QueryPerformanceCounter(&endTime);
    run_time = (((endTime.QuadPart - startTime.QuadPart) * 1000.0) / cpuFreq.QuadPart);
    cout << "listInsertFront run_time: "<< run_time <<"ms" << endl;
}

int main()
{
    Insert_Perfor();
    Insert_Front_Perfor();
    while(1);
}


运行结果及分析:

38cda2a0c764159ad4e521663505ddb0.png

数组性能远远优于其它容器原因是数组是直接分配内存包含100万个数据元素。但是向量、列表和多重集不会提前知道集合的大小,都是动态分配内存的。而且对于每一个数据,列表除了要为其设置前项指针和后向指针外,还要分配一个列表元素来存储数据。多重集一直保持其集合为有序的状态。

总结插入测试的测试结果:在知道集合大小的情况下,数组的性能最佳,在集合大下未知的情况下,插入整数,向量优于列表。将元素插入容器前端时,列表优于向量。

3.删除测试

案例:

//向量形式删除
template <class T>
void vectorDelete(vector<T> *v)
{
    while(!v->empty()){
        v->pop_back();
    }
}

//向量形式前端删除
template <class T>
void vectorDeleteFront(vector<T> *v)
{
    while(!v->empty()){
        v->erase(v->begin());
    }
}

//列表形式删除
template <class T>
void listDelete(list<T> *l)
{
    while(!l->empty()){
        l->pop_back();
    }
}

//列表形式前端删除
template <class T>
void listDeleteFront(list<T> *l)
{
    while(!l->empty()){
        l->pop_front();
    }
}

总结删除测试结果:(很多关于插入效率的结论同样适用于删除)

(1). 向量擅长于尾部对元素进行插入(或删除)操作。此操作与集合大小无关,是固定时间的操作。

(2). 除对集合尾部进行操作外,采用向量进行其他任何位置的插入(或删除)都是糟糕的选择。性能的损失与插入(或删除)点到向量尾部元素的距离成正比。(为什么?)

(3). 双向队列在集合的前端和尾部插入(或删除)元素效率都很高。在其他任何位置插入(或删除)元素效率都很低。

(4). 列表在集合的任何位置插入(或删除)元素效率都很高。

4. 遍历测试

案例:

.....

总结遍历测试结果:向量和数组的性能相同,并且远胜于列表。原因:容器遍历的关键元素为容器内存布局和系统缓存之间的交互作用。向量和数组的集合存储在连续内存空间,在物理存储器中是相邻的。当一个特定元素被加载到缓存中时,会同时加载相邻元素。(具体的个数由元素大小和缓存行大小决定)。列表容器不是这种情况,逻辑上相邻的列表元素在物理内存中未必相邻。列表除了存储元素值外,还必须存储前向指针和后向指针。单个元素占用内存空间过大,所以只有恨少的元素被载入缓存行。

5. 查找测试

案例:

总结 查找测试结果:当进行元素查找时,使用成员find()方法,多重集容器胜过其他容器。多重集容器的有序特性在查找方面带来巨大优势。

6. 使用函数对象的版本明显优于使用函数指针的版本,因为函数指针在运行时才被解析,无法被内联。而函数对象在编译时被确认,这使得编译器可以自由地内联operator()函数并显著提升性能。

7. 要点:

(1). STL是抽象、灵活性和效率的一种结合。它基本上实现了最好的算法。

(2). 每一个容器都有它的优劣势,要根据实际应用场景来判断使用哪种容器性能更好。

了解STL所忽略的问题,才能在特定的情况下,实现超过STL性能的算法。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 《提高C性能编程技术》是一本有关优化C语言程序性能编程指南。本书的目的是为开发人员提供一系列实用的技术和策略,帮助他们优化C语言程序的性能。 首先,本书介绍了一些性能优化的基本概念和原则,如减少循环次数、降低内存访问延迟等。通过了解这些基本原则,开发人员可以更好地理解性能优化的重要性,并能够在实际编程中应用这些原则。 其次,本书介绍了一些具体的优化技术和方法。例如,使用合适的数据结构和算法可以提高程序的执行效率;正确地使用指针和数组可以减少内存占用和提高访问速度;合理地使用编译器优化选项可以改善程序的性能等等。这些技术和方法都是在实际应用中经过验证的,可以帮助开发人员充分利用C语言的特性和优势,达到性能优化的目的。 此外,本书还介绍了一些常见的性能优化问题及其解决方法。例如,如何避免伪共享、如何减少内存碎片等。对于遇到这些问题的开发人员来说,本书的指导将非常有价值。 总之,《提高C性能编程技术》是一本非常实用的编程指南,可以帮助开发人员提高C语言程序的性能。通过深入理解性能优化的原则和方法,开发人员能够编写出更高效、更优化的程序,提高系统的响应速度和性能。这对于提升用户体验、优化资源利用非常重要。读者可以通过阅读本书,了解C语言性能优化的最佳实践,并将其应用于实际项目中。 ### 回答2: 《提高C性能编程技术》是一本关于提高C语言程序性能编程指南,旨在帮助开发者了解和使用各种编程技术以优化C语言程序的性能。 该书介绍了一系列的编程技术和最佳实践,可以帮助开发人员在编写C语言程序时对性能进行优化。 首先,该书介绍了一些基本的性能调优原则,例如减少函数调用、避免频繁的内存分配和释放等。这些原则可以帮助程序员在最初的设计和开发阶段就考虑性能问题,从而避免后期的性能瓶颈。 另外,该书还详细介绍了一些针对C语言的特定编程技术,如使用位运算替代乘法和除法、使用寄存器变量优化循环等。这些技术可以显著提高程序的执行速度和效率。 此外,该书还详细介绍了一些常用的性能调试工具和性能优化方法,如使用性能分析器识别程序的性能瓶颈,并给出了一些优化建议。这些工具和方法可以帮助开发者定位和解决程序的性能问题。 总之,《提高C性能编程技术》是一本非常实用的指南,对于想要优化C语言程序性能的开发人员来说具有很大的帮助。通过学习和应用该书中的编程技术,开发者可以提高程序的执行效率,从而提升软件的性能和用户体验。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值