C++之STL（二&三）

csdn_HZW

已于 2024-06-20 11:07:48 修改

阅读量821

点赞数 9

文章标签： c++

于 2024-06-19 23:00:46 首次发布

本文链接：https://blog.csdn.net/CSDN_HZW/article/details/139794228

版权

1、vector源码刨析

1.1、数据结构以及动态扩充算法

其实vector内部有三个指针，分别是数据的第一个元素Myfirst、数据的最后一个元素的下一个位置Mylast，最后一个空间的下一个位置Myend；当你插入数据的时候，先判断当前容量够不够，不够的话通过内存分配子扩充容量，至于扩充的算法，可能有些编译器不大相同，像vc6.0的话，就是成倍扩充，比如当前是2，扩充到4，4不够用了之后，又扩充到8，以此类推。但是像visual studio，就是按照容量的一半进行扩充。

#include <vector>
#include <iostream>
using namespace std;

int main() {
    vector<int> v;
    v.push_back(1);
    cout << v.capacity() << endl;
    v.push_back(1);
    cout << v.capacity() << endl;
    v.push_back(1);
    cout << v.capacity() << endl;
    v.push_back(1);
    cout << v.capacity() << endl;
    v.push_back(1);
    cout << v.capacity() << endl;
    v.push_back(1);
    cout << v.capacity() << endl;
    v.push_back(1);
    cout << v.capacity() << endl;
    v.push_back(1);
    cout << v.capacity() << endl;
    return 0;
}

//输出
1
2
4
4
8
8
8
8

1.2、如何实现连续空间

如果是从尾部插入，分配内存结束后，先在尾部的位置插入数据，然后再将之前的数据一个个复制过去。

如果是从中间插入，分配内存后，先在该位置插入数据，然后再将该位置的前面数据搬下来，然后将该位置的后面数据依次搬到该位置的后面。

1.3、内存分配子

先上代码

#include <vector>
#include <iostream>
using namespace std;

class Test
{
public:
    Test()
    {
        cout << "Test() ..." << endl;
    }
    Test(const Test& other)
    {
        cout << "copy Test ..." << endl;
    }
    ~Test()
    {
        cout << "~Test() ..." << endl;
    }
};

int main() {
    vector<Test> v;
    Test t1;
    Test t2;
    Test t3;

    v.push_back(t1);
    v.push_back(t2);
    v.push_back(t3);

    return 0;
}

// 输出
Test() ...
Test() ...
Test() ...
copy Test ...
copy Test ...
copy Test ...
~Test() ...
copy Test ...
copy Test ...
copy Test ...
~Test() ...
~Test() ...
~Test() ...
~Test() ...
~Test() ...
~Test() ...
~Test() ...
~Test() ...

根据例子来分析分配内存的过程

前三行的构造：是定义了三个变量打印出来的；

v.push_back(t1)具体过程：

1、先是调用_Allocate函数。_Allocate里面会调用operator new分配新内存，然后算出偏移量，也就是要在哪插入数据

2、然后调用_Ufill函数将数据插入进去。_Ufill里面最终会调用placement new去调用拷贝构造函数将复制的数据插入新内存。(在这边就会打印出第四行的拷贝构造)

这边为什么不直接调用new operator直接开辟空间和调用拷贝构造？因为要算出偏移量，每一个类型的偏移量都不一样，所以必须先分配内存，然后再根据偏移量插入到新内存。

3、然后再调用_Move将该位置的前面数据搬到新空间当中去（因为这是第一个元素，所以没有前面数据）

4、然后再调用_Move将该位置的后面数据搬到新空间当中去（因为这是第一个元素，所以没有后面数据）

5、代码中这边还有需要显示调用析构函数和释放旧内存，因为这是第一块内存，而且构造出来的数据是要放在第一块内存中，所以这边没有调用析构和释放内存。

6、然后将三个指针改成相对应的位置。

v.push_back(t2)具体过程：

第五行的拷贝原理同第四行。

前两步跟上面一样；

3、调用_Move将该位置之前的数据遍历，遍历里面调用placement new，调用拷贝构造将数据拷贝到新内存中，因为这个t2前面只有一个t1，所以就只拷贝t1，所以打印出了第六行的拷贝构造函数。

4、同上

5、这边已经将数据都拷贝到新的内存当中了，所以需要释放旧的内存。最后面会显示的调用析构函数，打印出了第七行的析构函数。然后再调用operator delete释放上面operator new的内存。这边析构的是：旧内存中的数据，因为已经将旧内存中的数据拷贝到新内存中了，旧内存就没用了，此时旧内存有t1和t2，所以就只打印出两行析构。跟第一个push_back不同的是，第一个的时候没有旧数据，所以不需要删除和析构。

6、然后将三个指针改成相对应的位置。

v.push_back(t3)具体过程：

第八行的拷贝原理同第四行。

前两步跟上面一样；

3、调用_Move将该位置之前的数据遍历，遍历里面调用placement new，调用拷贝构造将数据拷贝到新内存中，因为这个t3前面有t1和t2，拷贝了两个，所以打印出了第九、十行的拷贝构造函数。

4、同上（注意，如果是在中间插入，那这边第四步调用的函数和第三步一样，只是参数不一样，里面都是遍历，然后拷贝）

5、这边已经将数据都拷贝到新的内存当中了，所以需要释放旧的内存。最后面会显示的调用析构函数，打印出了第十一、十二行的析构函数。然后再调用operator delete释放上面operator new的内存。这边析构的是：旧内存中的数据，因为已经将旧内存中的数据拷贝到新内存中了，旧内存就没用了，此时旧内存就只有一个t1，所以就只打印出一行析构。跟第一个push_back不同的是，第一个的时候没有旧数据，所以不需要删除和析构。

6、然后将三个指针改成相对应的位置。

剩下的6个析构函数，分别是t1t2t3生命周期结束的时候调用，还有v生命周期结束的时候也会去销毁里面的元素，所以v里面也有三个析构，这样加起来，就是上面代码输出的样子。

这边再复习一下new的三种用法：

new operator：分配空间+构造函数

opearator new：只分配空间，不调用构造函数

placement new：不分配空间，调用构造函数

2、ptr_vector

vector是值语义。

往容器中插入指针，容器拷贝的仅仅是指针，容器并不负责指针所指向的内存空间的释放。

往容器中插入的是类对象，容器会拷贝整个对象。（容器中拷贝的对象与原对象脱离关系）

#include <vector>
#include <iostream>
using namespace std;

class Test
{
public:
    Test()
    {
        cout << "Test() ..." << endl;
    }
    Test(const Test& other)
    {
        cout << "copy Test ..." << endl;
    }
    ~Test()
    {
        cout << "~Test() ..." << endl;
    }
};

int main() {
    vector<Test*> v;
    Test* t1 = new Test();
    Test* t2 = new Test();
    Test* t3 = new Test();

    v.push_back(t1);
    v.push_back(t2);
    v.push_back(t3);

    return 0;
}

// 输出
Test() ...
Test() ...
Test() ...

push_back中没有再调用拷贝构造函数了，v的生命周期结束的时候也不会去释放里面的元素。所以我们想实现一个ptr_vector，负责指针所指向的内存空间的释放。

ptr_vector.h

#include <iostream>
using namespace std;

#include <vector>
#include <memory>

template <typename T>
class ptr_vector : public std::vector<T*>
{
public:
    void clear()
    {
        typename std::vector<T*>::iterator it;
        for(it = this->begin(); it != this->end(); ++it)
        {
            delete *it;  // 销毁指针变量指向的内存
        }
        std::vector<T*>::clear();  // 销毁T*指针变量本身
    }

    void push_back(T* const &val)
    {
        // 用auto_ptr接管val所有权，这是为了防止下面push_back过程的operator new 开辟内存失败（内存已经开辟了，但是可能被异常了），
        // 也就是说这个指针并没有插入成功，这样上面clear的时候就不会销毁这块内存，导致内存泄露
        std::auto_ptr<T> ptr(val);  // 如果下面的push_back失败了，这个val现在是一个局部智能指针，ptr会释放，同时val也会释放
        vector<T*>::push_back(val);
        // 插入成功后，ptr要释放所有权，将val交还给ptr_vector
        ptr.release();
    }

    // 或者可以重载push_back方法，将智能指针作为参数
    void push_back(auto_ptr<T>& val)
    {
        vector<T*>::push_back(val.get());
        val.release();  // 插入成功后归还所有权
    }

    ~ptr_vector()
    {
        clear();
    }
};

main.cpp

#include <iostream>
#include "ptr_vector.h"

class Test
{
public:
    Test()
    {
        cout << "Test() ..." << endl;
    }
    Test(const Test& other)
    {
        cout << "copy Test ..." << endl;
    }
    ~Test()
    {
        cout << "~Test() ..." << endl;
    }
};

int main() {
    ptr_vector<Test> v;
    Test* t1 = new Test();
    Test* t2 = new Test();
    Test* t3 = new Test();

    v.push_back(t1);
    v.push_back(t2);
    v.push_back(t3);
    return 0;
}

// 输出
Test() ...
Test() ...
Test() ...
~Test() ...
~Test() ...
~Test() ...