stl源码剖析_stl源码剖析(九)deque

最新推荐文章于 2023-12-27 14:01:43 发布

weixin_39746794

最新推荐文章于 2023-12-27 14:01:43 发布

阅读量191

点赞数

vector是单向开口的连续线性空间，deque则是一种双向开口的连续线性空间。如图1

deque与vector的差异：

1.deque允许于参数时间内对起头端进行元素的插入或移除操作。

2.deque没有所谓容量(capacity)概念，因为deque是动态地以分段连续空间组合而成。

3.deque也提供了Ramdon Access Iterator，但它的迭代器并不是普通的指针，比vector复杂多些。因此除非必要，我们尽可能使用vector而非deque。

【deque中控器】

对线性连续空间array或vector来说，array无法成长，vector虽可成长，却只能向尾端成长，而且代价很大。

deque在逻辑上也是连续空间，由一段一段的定量连续空间构成，根据需要可配置一段定量的连续空间串接在deque的头端或尾端。deque的最大任务便是在这些分段的定量连续空间上，维护其整体连续的假象，并提供随机存取的接口，避开了“重新配置、复制、释放”的轮回，但迭代器架构更复杂了。

为了管理这些连续分段的空间，deque通过中央控制器来进行管理。deque的结构设计如图2

deque采用一块所谓的map(注意，不是STL的map容器)作为主控。这里的map是一小块连续的空间，其中每个元素(此处称为一个节点，node)都是指针，指向另一段(较大的)连续空间，称为缓冲区。缓冲区才是deque的存储主体。

SGI STL允许我们指定缓冲区大小，默认值0表示将使用512 bytes缓冲区。

template  class deque {public:                         // Basic types  typedef T value_type;  typedef value_type* pointer;  ...  protected:                      // Internal typedefs  //元素的指针的指针  typedef pointer* map_pointer;  protected:                      // Data members  //指向map,map是块连续空间，其内的每个元素  //都是一个指针(称为节点)，指向一块缓冲区  map_pointer map;  //map内可容纳多少指针  size_type map_size;  ...}

【deque的迭代器】

deque是分段连续空间。维持其“整体连续”假象的任务，落在了迭代器的operator++和operator--两个运算子身上。

deque迭代器具备的结构：

1.必须能够指出分段连续空间(亦即缓冲区)在哪里。

2.必须能够判断自己是否已经处于其所在缓冲区的边缘，如果是，一旦前进或后退时就必须跳跃至下一个缓冲区。

为了能够正确跳跃，deque必须随时掌握管控中心(map)，实现代码如下：

template struct __deque_iterator { //未继承std::iterator  typedef __deque_iterator             iterator;  typedef __deque_iterator const_iterator;  static size_t buffer_size() {return __deque_buf_size(BufSiz, sizeof(T)); }    //未继承std::iterator，所以必须自行撰写五个必要的迭代器相应型别  typedef random_access_iterator_tag iterator_category; //(1)  typedef T value_type;//(2)  typedef Ptr pointer;//(3)  typedef Ref reference;//(4)  typedef size_t size_type;  typedef ptrdiff_t difference_type;//(5)  typedef T** map_pointer;  typedef __deque_iterator self;  //保持与容器的联结  T* cur;   //此迭代器所指之缓冲区中的现行(current)元素  T* first; //此迭代器所指之缓冲区的头  T* last;  //此迭代器所指之缓冲区的尾(含备用空间)  map_pointer node;...}

决定缓冲区大小的函数buffer_size()，调用__deque_buf_size()(全局函数)

如果n为0，表示buffer size使用默认值，那么

如果sz(元素大小，sizeof(value_type))小于512，传回512/sz，

如果sz不小于512，传回1.

/***/inline size_t __deque_buf_size(size_t n, size_t sz){return n != 0 ? n : (sz < 512 ? size_t(512 / sz) : size_t(1));}

deque的中控器、缓冲区、迭代器的相互关系入图3：

操作举例：

1.元素形态为int，缓存区大小为8(个元素)的deque。

2.deque拥有20个元素。

通过以上两个条件，20个元素需要20/8 = 3 个缓冲区，所以map之内运用了三个节点。

迭代器start内的cur指针指向缓存区第一个元素，迭代器finish内的cur指针指向缓冲区的最后一个元素(的下一个位置)，deque的结构布局如图4:

deque::begin()传回迭代器start，deque::end()传回迭代器finish。图中每个缓冲区可储存8个int元素。

map大小为8(起始值)。

由于迭代器内对各种指针运算都进行了重载操作，所以各种指针运算如加、减、前进、后退都不能直观视之。其中最关键的就是一旦行进时遇到缓冲区边缘，视前进或后退而定，可能需要调用set_node()跳一个缓冲区：

  void set_node(map_pointer new_node) {    node = new_node;    first = *new_node;    last = first + difference_type(buffer_size()); //内部用到了上文提到了__deque_buf_size()  }

重载运算符如下：

//计算两个迭代器之间相差的元素个数即距离。

//这里是用后一个迭代器减去前一个迭代器。

difference_type operator-(const self& x) const {    return difference_type(buffer_size()) * (node - x.node - 1) +      (cur - first) + (x.last - x.cur);  }  self& operator++() {    ++cur; //切换至下一个元素    if (cur == last) {      //如果已达到所在缓冲区的尾端       set_node(node + 1);   //就切换至下一个(亦即缓冲区)      cur = first;          //的第一个元素。    }    return *this;   }  self operator++(int)  {    self tmp = *this;    ++*this;    return tmp;  }  self& operator--() {    if (cur == first) {      //如果已达所在缓冲区的头端，      set_node(node - 1);    //就切换至前一个结点(亦即缓冲区)      cur = last;            //的最后一个元素(的下一位置)    }    --cur;//切换至前一个元素    return *this;  }  self operator--(int) {    self tmp = *this;    --*this;    return tmp;  }以下重载实现随机存取。迭代器可直接跳跃n个距离self& operator+=(difference_type n) {    difference_type offset = n + (cur - first);    if (offset >= 0 && offset < difference_type(buffer_size()))      cur += n; //1、目标位置和当前迭代器在同一个缓冲区    else {       //2、目标位置和当前迭代器不在同一个缓冲区       //此处计算出便宜几个缓冲区。       //a)offset > 0 表示目标向后定位，直接offset / difference_type(buffer_size())求整。       //b)offset < 0 表示目标先前定位：       //  b-1) 既然offset < 0 说明无论怎样，node_offset都要前进一个，       //       所以-difference_type((-offset - 1) / buffer_size())整体 -1.       //  b-2) (-offset - 1)是为了进位而存在。因为是对buffer_size()求整，       //        -offset 在 (0, buffer_size()]范围之内是不需要偏移node的，       //        这里-1就是为了解决-offset == buffer_size()时不偏移。                                 difference_type node_offset =        offset > 0 ? offset / difference_type(buffer_size())                   : -difference_type((-offset - 1) / buffer_size()) - 1;      //切换至正确结点(亦即缓冲区)，      //内部已重新指定first和last      set_node(node + node_offset);      //切换至正确的元素，这里画一下也好理解      cur = first + (offset - node_offset * difference_type(buffer_size()));    }    return *this;  }  self operator+(difference_type n) const {    self tmp = *this;    return tmp += n; //调用operator+=  }  //利用operator += 完成operator -=  self& operator-=(difference_type n) { return *this += -n; }   self operator-(difference_type n) const {    self tmp = *this;    return tmp -= n;  }  reference operator[](difference_type n) const { return *(*this + n); }  bool operator==(const self& x) const { return cur == x.cur; }  bool operator!=(const self& x) const { return !(*this == x); }  bool operator

【deque数据结构】

deque除了维护一个先前说过的指向map的指针外，还要做到：

1.维护start，finish两个迭代器。start指向第一个缓冲区的第一个元素，finish指向最后一个缓冲区的最后一个元素(的下一个位置)。

2.必须记住目前map大小。因为一旦map所提供的结点不足，就必须重新配置更大的一块map。

相关代码如下：

template  class deque {public:     typedef T value_type;  typedef value_type* pointer;  typedef size_t size_type;public:                         // Iterators  typedef __deque_iterator              iterator;  protected:                      // Internal typedefs  //元素指针的指针  typedef pointer* map_pointer;protected:                      // Data members  iterator start; //表现第一个节点  iterator finish; //表现最后一个节点   //指向map，map是块连续空间，  //其每个元素都是指针，指向一个节点(缓冲区)  map_pointer map;  //map内有多少个指针  size_type map_size; ... }

【deque的构造与内存管理】

1、构造

举例如下代码：

deque ideq(20, 9);

这个deque是缓冲区大小为8(个元素)，并令其保留20个元素空间，每个元素初值为9。deque的结构图如上图4。

deque自行定义了两个专属的空间配置器：

protected://专属之空间配置器，每次配置一个元素大小typedef simple_alloc data_allocator;//专属之空间配置器，每次配置一个指针大小typedef simple_alloc map_allocator;提供有一个constructor如下：deque(int n, const value_type& value):start(), finish(), map(0), map_size(0){fill_initialize(n, value);}fill_initialize()负责产生并安排好deque的结构，并将元素的初值设定妥当：template void deque::fill_initialize(size_type n,                                               const value_type& value) {  create_map_and_nodes(n); //把deque的结构都产生并安排好  map_pointer cur;  __STL_TRY {    //为每个结点的缓冲区设定初值    for (cur = start.node; cur < finish.node; ++cur)      uninitialized_fill(*cur, *cur + buffer_size(), value);//最后一个节点的设置稍有不同(因为尾端可能有备用空间，不必设初值)    uninitialized_fill(finish.first, finish.cur, value);  }  //commit or rollback#ifdef __STL_USE_EXCEPTIONS  catch(...) {    for (map_pointer n = start.node; n < cur; ++n)      destroy(*n, *n + buffer_size());    destroy_map_and_nodes();    throw;  }#endif /* __STL_USE_EXCEPTIONS */}

其中create_map_and_nodes()负责产生并安排好deque的结构：

template void deque::create_map_and_nodes(size_type num_elements) {  //需要结点数 = (元素个数 / 每个缓冲区可容纳的元素个数) + 1  //如果刚好整除，会多配一个节点。  size_type num_nodes = num_elements / buffer_size() + 1;   //一个map要管理几个节点。最少8个，最多是“所需节点数加2”  //(前后各预留一个，扩充时可用)  map_size = max(initial_map_size(), num_nodes + 2);  map = map_allocator::allocate(map_size);  //以上配置出一个“具有map_size个节点”的map    //这里令nstart和nfinish指向map被分配节点的前后两个点  //保持在此位置，可使头尾两端的扩充能量一样大。每个结点对应一个缓冲区。  map_pointer nstart = map + (map_size - num_nodes) / 2;  map_pointer nfinish = nstart + num_nodes - 1;      map_pointer cur;  __STL_TRY {    //为map内的每个现用结点配置缓冲区。所有缓冲区加起来就是deque的    //可用空间(最后一个缓冲区可能留有余裕)    for (cur = nstart; cur <= nfinish; ++cur)      *cur = allocate_node();  }  //commit or rollback#ifdef  __STL_USE_EXCEPTIONS   catch(...) {    for (map_pointer n = nstart; n < cur; ++n)      deallocate_node(*n);    map_allocator::deallocate(map, map_size);    throw;  }#endif /* __STL_USE_EXCEPTIONS */    //为deque内的两个迭代器start和end设定正确的内容  start.set_node(nstart);  finish.set_node(nfinish);  start.cur = start.first;  finish.cur = finish.first + num_elements % buffer_size();}

2、内存管理

举例如下操作：

deque ideq(20, 9);for(int i=0; i

当最后一个缓冲区只剩一个备用元素空间时，如果调用push_back()，则会引发调用push_back_aux()：

1.先配置一整块的缓存区。

2.再设妥新元素内容。

3.然后更改迭代器finish的状态。

template void deque::push_back_aux(const value_type& t) {  value_type t_copy = t;  reserve_map_at_back(); //若符合某种条件则必须重换一个map(其实就是map空间不够，要重新分配)  *(finish.node + 1) = allocate_node(); //配置一个新节点(缓冲区)  __STL_TRY {    construct(finish.cur, t_copy);      //针对标的元素设值    finish.set_node(finish.node + 1);   //改变finish，令其指向新节点。    finish.cur = finish.first;          //设定finish的状态  }  __STL_UNWIND(deallocate_node(*(finish.node + 1)));}push_front()函数操作如下：  void push_front(const value_type& t) {    if (start.cur != start.first) { //第一缓冲区尚有备用空间      construct(start.cur - 1, t);  //直接在备用空间上构造元素      --start.cur;                  //调整第一缓冲区的使用状态    }    else      push_front_aux(t); //第一缓冲区已无备用空间  }如果第一缓冲区无备用空间，就好调用push_front_aux()函数：// Called only if start.cur == start.first.template void deque::push_front_aux(const value_type& t) {  value_type t_copy = t;  reserve_map_at_front(); //若map空间不够，需要重新申请空间  *(start.node - 1) = allocate_node(); //配置一个新节点(缓冲区)  __STL_TRY {    start.set_node(start.node - 1);  //改变start，令其指向新节点。    start.cur = start.last - 1;      //设定start的当前cur指向。    construct(start.cur, t_copy);   //针对标的元素设值  }  //commit or rollback#ifdef __STL_USE_EXCEPTIONS  catch(...) {    start.set_node(start.node + 1);    start.cur = start.first;    deallocate_node(*(start.node - 1));    throw;  }#endif /* __STL_USE_EXCEPTIONS */}

通过上诉的push_back()和push_front()操作，基本上已充分展示了deque容器的空间运用策略。那什么时候会重新整治map呢？

在进行后插和前插的时候，降到了reserve_map_at_back()和reserve_map_at_front()，这两个函数就是负责整治map空间的，操作源码如下：

  void reserve_map_at_back (size_type nodes_to_add = 1) {    //因为下标是0~7,当是最后一个节点时finish.node - map = 7。所以+1是为了解决因下标    //问题导致的数量少1问题。    if (nodes_to_add + 1 > map_size - (finish.node - map))     //如果map尾端的节点空间不足     //符合以上条件则必须重换一个map(配置更大的，拷贝原来的，释放原来的)      reallocate_map(nodes_to_add, false);  }  void reserve_map_at_front (size_type nodes_to_add = 1) {    //当前半部分节点一个都不剩时    if (nodes_to_add > start.node - map)      reallocate_map(nodes_to_add, true);  }

前端插入和后端插入重新申请节点是有点区别的，后端插入时如果检测到只剩一个节点了就要重新申请，而前端插入则是一个节点都不剩时才重新申请。

map的重新申请最终调用的是reallocate_map()函数：

template void deque::reallocate_map(size_type nodes_to_add,                                              bool add_at_front) {  //旧节点的个数，因为下标是0~7，所以要+1才是真实的数量                                             size_type old_num_nodes = finish.node - start.node + 1;  //新节点的个数  size_type new_num_nodes = old_num_nodes + nodes_to_add;  //二级指针指向  map_pointer new_nstart;  if (map_size > 2 * new_num_nodes)  {    //此条件是为了防止出现一端已经用完，另一端却还有很多剩余节点的情况。    //比如一端pop_front()，另一端push_back(),此时没必要重新申请更大的map空间。    new_nstart = map + (map_size - new_num_nodes) / 2                      + (add_at_front ? nodes_to_add : 0);    if (new_nstart < start.node)      //前端剩余比较多，则前移      copy(start.node, finish.node + 1, new_nstart);    else      //后端剩余比较多则后移      copy_backward(start.node, finish.node + 1, new_nstart + old_num_nodes);  }  else   {    //新map大小，至少是2倍 + 2    size_type new_map_size = map_size + max(map_size, nodes_to_add) + 2;    //配置一块空间，准备给新map使用    map_pointer new_map = map_allocator::allocate(new_map_size);    //这里还是为了保证start在map的最中央区，保证首尾两端扩充一样。    //是前置的扩充就多加下nodes_to_add。    new_nstart = new_map + (new_map_size - new_num_nodes) / 2                         + (add_at_front ? nodes_to_add : 0);    //将原map内容拷贝过来    copy(start.node, finish.node + 1, new_nstart);    //释放原map    map_allocator::deallocate(map, map_size);    //设定新map的起始地址和大小    map = new_map;    map_size = new_map_size;  }  //重新设定迭代器start和finish的指向  start.set_node(new_nstart);  finish.set_node(new_nstart + old_num_nodes - 1);}

【deque的元素操作】

接下来讲解几个deque的操作函数，重点观察下deque对应的内存变化。

pop_front()和pop_back()是将元素拿掉，无论是前端拿还是后端拿，都需要考虑在某种条件下，将缓冲区释放掉：

pop_back()

void pop_back() {    if (finish.cur != finish.first) {      //最后缓冲区有一个(或更多)元素      --finish.cur; //调整指针      destroy(finish.cur); //将最后元素析构    }    else      //最后缓冲区没有元素      pop_back_aux();  }// Called only if finish.cur == finish.first.template void deque:: pop_back_aux() {  deallocate_node(finish.first);     //释放最后一个缓冲区  finish.set_node(finish.node - 1);  //调整finish的状态，使指向  finish.cur = finish.last - 1;      //上一个缓冲区的最后一个元素  destroy(finish.cur);               //将该元素析构。     }pop_front()  void pop_front() {    if (start.cur != start.last - 1) {      //第一个缓冲区有两个(或更多)元素      destroy(start.cur);    //将第一元素析构      ++start.cur;           //调整指针位置       }    else       //第一缓冲区仅有一个元素      pop_front_aux();   //内部会进行缓冲区的释放工作  }  template void deque::pop_front_aux() {  destroy(start.cur);             //将第一缓冲区的第一个(也是最好一个，唯一一个)元素析构  deallocate_node(start.first);   //释放第一缓冲区  start.set_node(start.node + 1); //调整start的状态，使指向   start.cur = start.first;        //下一个缓冲区的第一个元素}

clear()

clear() 用来清除整个deque，由于deque的最初状态(无任何元素时)保有一个缓冲区，因此，clear()完成之后恢复初始状态，也一样保留一个缓冲区。

template void deque::clear() {  //针对头尾以外的缓冲区进行释放  for (map_pointer node = start.node + 1; node < finish.node; ++node) {    //将缓冲区内的元素析构    destroy(*node, *node + buffer_size());    //释放缓冲区内存    data_allocator::deallocate(*node, buffer_size());  }  if (start.node != finish.node) {    //当有头尾两个缓冲区时    //将头缓冲区的目前所有元素析构    destroy(start.cur, start.last);    //将尾缓冲区的目前所有元素析构    destroy(finish.first, finish.cur);    //释放尾缓冲区内存，保留头缓冲区    data_allocator::deallocate(finish.first, buffer_size());  }  else    //只有一个缓冲区    //释放所有元素，但不释放内存。    destroy(start.cur, finish.cur);    //调整位置  finish = start;}erase()清除某个点的元素： //清除pos所指的元素。pos为清除点  iterator erase(iterator pos) {    iterator next = pos;    ++next;    difference_type index = pos - start; //清除点之前的元素个数    if (index < (size() >> 1)) {         //如果清除点之前的元素比较少，       copy_backward(start, pos, next);   //就移动清除点之前的元素      pop_front();                    //移动完毕，最前一个元素冗余，去除之。     }    else {                           //清除点之后的元素比较少      copy(next, finish, pos);       //就移动清除点之后的元素      pop_back();                    //移动完毕，最后一个元素冗余，去除之。    }    return start + index;  }

清除某个区间所有元素：

//清除[first, last)区间内的所有元素

template deque::iterator deque::erase(iterator first, iterator last) {  if (first == start && last == finish) {  //如果清除区间就是整个deque，    clear();                               //直接调用clear()即可。    return finish;  }  else {    difference_type n = last - first;              //清除区间的长度    difference_type elems_before = first - start;  //清除区间前方的元素个数     if (elems_before < (size() - n) / 2) {         //如果前方的元素比较少      copy_backward(start, first, last);           //向后移动前方元素(覆盖清除区间)      iterator new_start = start + n;              //标记deque的新起点         destroy(start, new_start);                   //移动完毕，将冗余的元素析构      //以下将冗余的缓冲去释放      for (map_pointer cur = start.node; cur < new_start.node; ++cur)        data_allocator::deallocate(*cur, buffer_size());      //设定新标志      start = new_start;    }    else {  //如果清除区间后方的元素比较少      copy(last, finish, first);            //向前移动后方元素(覆盖清除区间)      iterator new_finish = finish - n;     //标记deque的新尾点      destroy(new_finish, finish);          //移动完毕，将冗余的元素析构      //以下将冗余的缓冲区释放掉      //因为新的结尾已经是new_finish,如果要释放也是释放new_finish后面的一个node，      //所以此处是new_finish.node+1      for (map_pointer cur = new_finish.node + 1; cur <= finish.node; ++cur)        data_allocator::deallocate(*cur, buffer_size());      finish = new_finish; //设定deque的新尾点。    }    return start + elems_before;  }}

insert()

deque提供了许多版本的的insert，这里讲解下允许在某个点(之前)插入一个元素，并设定其值

//在position处插入一个元素，其值为x

  iterator insert(iterator position, const value_type& x) {    if (position.cur == start.cur) {   //如果插入点是deque最前端      push_front(x);                   //交给push_front去做。      return start;    }    else if (position.cur == finish.cur) {      //如果插入点是deque最尾端      push_back(x);                             //交给push_back去做。           iterator tmp = finish;      --tmp;      return tmp;    }    else {      //其它交给insert_aux去做。      return insert_aux(position, x);    }  }template typename deque::iteratordeque::insert_aux(iterator pos, const value_type& x) {  difference_type index = pos - start;   //插入点之前的元素个数  value_type x_copy = x;  if (index < size() / 2) {     //如果插入点之前的元素个数比较少    push_front(front());        //在最前端加入与第一个元素同值的元素    iterator front1 = start;    //以下标示记号，然后进行元素移动(元素向前移动)     ++front1;    iterator front2 = front1;    ++front2;    pos = start + index;    iterator pos1 = pos;    ++pos1;    copy(front2, pos1, front1);  //元素移动  }  else {                        //插入点之后的元素个数比较少    push_back(back());          //在最尾端加入与最后元素相同值的元素    iterator back1 = finish;    //以下标示记号，然后进行元素移动(元素向后移动)     --back1;    iterator back2 = back1;    --back2;    pos = start + index;    copy_backward(pos, back2, back1);    //元素移动  }  *pos = x_copy;  return pos;}

插入元素的移动操作有点复杂。

【总结】

1.如开头所说，deque的复杂度和vector不可以道里计，deque的各个运算层面都是比较复杂的，因此除非必要，应尽可能的使用vector。

2.对deque的排序，为了最高效率，可将deque先完整复制到一个vector，将vector排序后(STL的sort算法)，再复制会deque。

3.deque的内部涉及到清除、移动时，都分操作点之前和之后来操作，目的是为了提升效率。

weixin_39746794

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫