STL学习笔记之容器--list(二)源码剖析

本文深入解析STL列表(list)的双向链表结构,详细阐述了其迭代器的工作原理,并具体介绍了基本数据结构、操作实现以及特殊操作如翻转与排序的实现细节。
STL提供的list是一个双向链表容器,对应的迭代器类型为Bidirectional Iterators. 对于双向链表我们可以方便的在任意位置进行插入和删除操作,list每个节点的内存位置之间没有必然联系。
1. list 迭代器
链表由许多节点链接在一起构成,list中的节点的定义如下:

// ListNodeBase定义
struct _List_node_base {
  _List_node_base* _M_next;
  _List_node_base* _M_prev;
};
 
// ListNode定义
template <class _Tp>
struct _List_node : public _List_node_base {
  _Tp _M_data;  // 数据域
};

list的迭代器定义如下(主要是迭代器的类型说明,以及遍历操作++/–的实现):

struct _List_iterator_base {
  typedef size_t                     size_type;
  typedef ptrdiff_t                  difference_type;
  // 迭代器类型为 bidirectional_iterator_tag
  typedef bidirectional_iterator_tag iterator_category;
  // 指向的ListNode
  _List_node_base* _M_node;
  // 构造函数
  _List_iterator_base(_List_node_base* __x) : _M_node(__x) {}
  _List_iterator_base() {}
  // 前进与后退操作
  void _M_incr() { _M_node = _M_node->_M_next; }
  void _M_decr() { _M_node = _M_node->_M_prev; }
  // ==以及!=操作符
  bool operator==(const _List_iterator_base& __x) const {
    return _M_node == __x._M_node;
  }
  bool operator!=(const _List_iterator_base& __x) const {
    return _M_node != __x._M_node;
  }
};  
 
// List Iterator 定义
template<class _Tp, class _Ref, class _Ptr>
struct _List_iterator : public _List_iterator_base {
  typedef _List_iterator<_Tp,_Tp&,_Tp*>             iterator;
  typedef _List_iterator<_Tp,const _Tp&,const _Tp*> const_iterator;
  typedef _List_iterator<_Tp,_Ref,_Ptr>             _Self;
 
  typedef _Tp value_type;
  typedef _Ptr pointer;
  typedef _Ref reference;
  typedef _List_node<_Tp> _Node;
 
  _List_iterator(_Node* __x) : _List_iterator_base(__x) {}
  _List_iterator() {}
  _List_iterator(const iterator& __x) : _List_iterator_base(__x._M_node) {}
 
  // 解引用操作
  reference operator*() const { return ((_Node*) _M_node)->_M_data; }
  // -> 操作, 基于解引用操作实现
  pointer operator->() const { return &(operator*()); }
 
  // 前置自增操作符
  _Self& operator++() { 
    this->_M_incr();
    return *this;
  }
  // 后置自增操作符
  _Self operator++(int) { 
    _Self __tmp = *this;
    this->_M_incr();
    return __tmp;
  }
  // 前置自减从操作符
  _Self& operator--() { 
    this->_M_decr();
    return *this;
  }
  // 后置自减操作符
  _Self operator--(int) { 
    _Self __tmp = *this;
    this->_M_decr();
    return __tmp;
  }
};
2. list 基本数据结构
list的基本数据结构定义于_List_base之中,里面包含了节点空间的分配和回收操作(get_node/put_node),以及构造函数与析构函数,在析构函数中进行了clear操作。

// List Base 定义
// _Alloc 使用标准空间配置器
template <class _Tp, class _Alloc>
class _List_base 
{
public:
  typedef _Alloc allocator_type;
  allocator_type get_allocator() const { return allocator_type(); }
 
  // 构造函数
  _List_base(const allocator_type&) {
    _M_node = _M_get_node();    // 分配一个节点的空间
    _M_node->_M_next = _M_node; // next 指针指向自己
    _M_node->_M_prev = _M_node; // prev 指针指向自己
  }
  // 析构函数
  ~_List_base() {
    clear();                    // 清空所有节点
    _M_put_node(_M_node);       // 回收节点的空间
  }
 
  void clear();
 
protected:
  typedef simple_alloc<_List_node<_Tp>, _Alloc> _Alloc_type;
  // 分配一个节点的空间
  _List_node<_Tp>* _M_get_node() { return _Alloc_type::allocate(1); }
  // 回收一个节点的空间
  void _M_put_node(_List_node<_Tp>* __p) { _Alloc_type::deallocate(__p, 1); } 
 
protected:
  // 定义一个指针, 指向end()
  _List_node<_Tp>* _M_node;
};
 
// clear 函数
template <class _Tp, class _Alloc>
void 
_List_base<_Tp,_Alloc>::clear() 
{
  // 取得指向第一个节点的指针
  _List_node<_Tp>* __cur = (_List_node<_Tp>*) _M_node->_M_next;
  while (__cur != _M_node) {
    // 取出当前节点
    _List_node<_Tp>* __tmp = __cur;
    __cur = (_List_node<_Tp>*) __cur->_M_next;
    // 析构节点所携带的对象
    _Destroy(&__tmp->_M_data);
    // 回收节点的空间
    _M_put_node(__tmp);
  }
  // 修正节点指针
  _M_node->_M_next = _M_node;
  _M_node->_M_prev = _M_node;
}
list中定义了一个指针_M_node,它指向一个特殊的list节点(即链表末尾的空白节点),list可以通过_M_node来遍历其他所有节点。在构造函数中可以看到_M_node的next指针和prev指针都是指向自己的,事实上,_M_node即为end(),其next指针指向真正的起始数据节点,基于_M_node可以方便的实现很多函数(定义于list内部):
iterator begin()      { return (_Node*)(_M_node->_M_next); }
  iterator end()        { return _M_node; }
  bool empty() const    { return _M_node->_M_next == _M_node; }
  size_type size() const{
    size_type __result = 0;
    distance(begin(), end(), __result);
    return __result;
  }
  reference front()     { return *begin(); }
  reference back()      { return *(--end()); }
list是一个环状的双向链表,如图:(图片来源于《STL源码剖析》,已修改)
STL list环状链表表示结构


STL list环状链表表示结构
3. list 基本操作的实现

这里是list内部一些基本操作的实现,其中transfer是一个比较重要的操作,因为很多其他操作都基于transfer来实现,而且基于这个操作也很好理解函数的意义。transfer是一个protected member function,其对外的包装接口为splice函数。

template <class _Tp, class _Alloc = __STL_DEFAULT_ALLOCATOR(_Tp) >
class list : protected _List_base<_Tp, _Alloc> {
public:
  // ==========================================================================
  // 两个链表进行交换操作
  // ==========================================================================
  // swap操作,通过全局的swap实现,直接交换两个链表的_M_node指针
  void swap(list<_Tp, _Alloc>& __x) { __STD::swap(_M_node, __x._M_node); }
 
  // ==========================================================================
  // 元素插入操作
  // ==========================================================================
  // 在指定位置插入一个值
  iterator insert(iterator __position, const _Tp& __x) {
    // 构造一个节点
    _Node* __tmp = _M_create_node(__x);
    // 插入节点到position位置
    __tmp->_M_next = __position._M_node;
    __tmp->_M_prev = __position._M_node->_M_prev;
    __position._M_node->_M_prev->_M_next = __tmp;
    __position._M_node->_M_prev = __tmp;
    // 返回指向新插入的节点
    return __tmp;
  }
 
  // 在指定位置插入一个节点,节点由默认构造函数负责初始化
  iterator insert(iterator __position) { return insert(__position, _Tp()); }
 
  // 在链表头插入元素
  void push_front(const _Tp& __x) { insert(begin(), __x); }
  void push_front() {insert(begin());}
  // 在链表尾部插入元素
  void push_back(const _Tp& __x) { insert(end(), __x); }
  void push_back() {insert(end());}
 
  // ==========================================================================
  // 元素删除操作
  // ==========================================================================
  // 删除指定位置的元素
  iterator erase(iterator __position) {
    _List_node_base* __next_node = __position._M_node->_M_next;
    _List_node_base* __prev_node = __position._M_node->_M_prev;
    _Node* __n = (_Node*) __position._M_node;
    __prev_node->_M_next = __next_node;
    __next_node->_M_prev = __prev_node;
    _Destroy(&__n->_M_data);
    _M_put_node(__n);
    // 返回指向被删除节点的下一个节点
    return iterator((_Node*) __next_node);
  }
  // 清空操作,调用父类的clear实现
  void clear() { _Base::clear(); }
 
  // resize 操作
  void resize(size_type __new_size, const _Tp& __x)
  {
    iterator __i = begin();
    size_type __len = 0;
    for ( ; __i != end() && __len < __new_size; ++__i, ++__len)
      ;
    // 如果 len == new_size 说明链表后面还有元素,那么这些元素需要删掉
    if (__len == __new_size)
      erase(__i, end());
    // 否则,说明链表的节点数没有 new_size 这么多,需要在末尾新插入元素
    else                          // __i == end()
      insert(end(), __new_size - __len, __x);
  }
  void resize(size_type __new_size) { this->resize(__new_size, _Tp()); }
 
  // pop 操作
  void pop_front() { erase(begin()); }
  void pop_back() { 
    iterator __tmp = end();
    erase(--__tmp);
  }
 
protected:
  // ==========================================================================
  // 元素转移操作
  // ==========================================================================
  // 把[first, last)内的所有元素移动到position之前
  // 区间不可重叠,即position不能位于[first, last)区间内部
  void transfer(iterator __position, iterator __first, iterator __last) {
    if (__position != __last) {
      // Remove [first, last) from its old position.
      __last._M_node->_M_prev->_M_next     = __position._M_node;
      __first._M_node->_M_prev->_M_next    = __last._M_node;
      __position._M_node->_M_prev->_M_next = __first._M_node; 
 
      // Splice [first, last) into its new position.
      _List_node_base* __tmp      = __position._M_node->_M_prev;
      __position._M_node->_M_prev = __last._M_node->_M_prev;
      __last._M_node->_M_prev     = __first._M_node->_M_prev; 
      __first._M_node->_M_prev    = __tmp;
    }
  }
 
public:
  // 把链表x的节点转移到position位置
  void splice(iterator __position, list& __x) {
    if (!__x.empty()) 
      this->transfer(__position, __x.begin(), __x.end());
  }
 
  // 将i所指元素移动到position
  void splice(iterator __position, list&, iterator __i) {
    iterator __j = __i;
    ++__j;
    // 如果i和position指向同一个元素,则不需要进行任何操作
    // 如果i所指节点就是位于position所指节点的前面一个节点,也不需要进行任何操作
    if (__position == __i || __position == __j) return;
    // 将区间[i, j)移动到position
    this->transfer(__position, __i, __j);
  }
 
  // 对transfer的简单包装,区间不可重叠
  void splice(iterator __position, list&, iterator __first, iterator __last) {
    if (__first != __last) 
      this->transfer(__position, __first, __last);
  }
 
  // 删除具有指定值的元素
  void remove(const _Tp& __value)
  {
    iterator __first = begin();
    iterator __last = end();
    while (__first != __last) {
      iterator __next = __first;
      ++__next;
      if (*__first == __value) erase(__first);
      __first = __next;
    }
  }
 
  // 如果连续的几个元素具有相同的值,则删除相同的,只留一个
  void unique()
  {
    iterator __first = begin();
    iterator __last = end();
    if (__first == __last) return;
    iterator __next = __first;
    while (++__next != __last) {
      if (*__first == *__next)
        erase(__next);
      else
        __first = __next;
        __next = __first;
    }
  }
 
  // 合并两个已经排好序的链表, 默认从小到大排序
  // 基于transfer实现,把x中的节点转移到本链表适当的位置
  void merge(list& __x)
  {
    iterator __first1 = begin();
    iterator __last1 = end();
    iterator __first2 = __x.begin();
    iterator __last2 = __x.end();
    while (__first1 != __last1 && __first2 != __last2)
      if (*__first2 < *__first1) {
        iterator __next = __first2;
        // 基于transfer实现
        transfer(__first1, __first2, ++__next);
        __first2 = __next;
      }
      else
        ++__first1;
    if (__first2 != __last2) transfer(__last1, __first2, __last2);
  }
};
4. reverse与sort
《STL源码剖析》一书中reverse是通过调用transfer来实现的,就是顺序遍历链表,然后不断的把元素插入的begin()之前,这个过程还是非常好理解的,源代码如下:


但我实际找到的SGI STL的代码并不是基于transfer实现的,而是通过遍历链表的时候,不断的交换节点的next和prev指针来实现的,代码如下:

class list
{
public:
  // 翻转链表
  void reverse()
  {
    __List_base_reverse(this->_M_node);
  }
  // ...
}
 
// 翻转链表的实现
inline void __List_base_reverse(_List_node_base* __p)
{
  _List_node_base* __tmp = __p;
  do {
    __STD::swap(__tmp->_M_next, __tmp->_M_prev);
    __tmp = __tmp->_M_prev;     // Old next node is now prev.
  } while (__tmp != __p);
}
这个实现过程画个图的话也是很好理解的:
基于swap next和prev指针实现list翻转

list由于自身的特性(bidirectional iterator),显然不能够试用std::sort,STL提供了list的一个member function,用于排序,sort的源代码如下:

class list
{
public:
  // 排序操作
  void sort()
  {
    // 只有链表的长度大于等于2才进行排序操作
    if (_M_node->_M_next != _M_node && _M_node->_M_next->_M_next != _M_node) {
      list<_Tp, _Alloc> __carry;
      list<_Tp, _Alloc> __counter[64];
      int __fill = 0;
      while (!empty()) {
        __carry.splice(__carry.begin(), *this, begin());
        int __i = 0;
        while(__i < __fill && !__counter[__i].empty()) {
          __counter[__i].merge(__carry);
          __carry.swap(__counter[__i++]);
        }
        __carry.swap(__counter[__i]);         
        if (__i == __fill) ++__fill;
      } 
 
      for (int __i = 1; __i < __fill; ++__i)
        __counter[__i].merge(__counter[__i-1]);
      swap(__counter[__fill-1]);
    }
  }
}
这段代码并不容易理解,需要在脑袋里面模拟执行几遍才好。为了更好的理解这个过程,可以用Visual Studio进行跟踪一下,虽然代码风格/实现不太一致,不过过程还是一样的。我所理解的是,counter数组的每个元素可存储的元素个数为2^i个,如:
counter[0] 最多存储 1 个元素
counter[1] 最多存储 2 个元素
counter[2] 最多存储 4 个元素
counter[3] 最多存储 8 个元素
... 
在VS中跟踪时的监控值如下:
在VS中跟踪list sort实现

对sort过程的伪代码理解如下:

list::sort():
    if 长度 < 2:
        return
    fill = 0
    carry       : list
    counter[64] : list
    while list非空:
        取出list的begin()节点并merge到carry
        # carry不断收集元素,直到收集完毕或者下一层为空
        for i in [0, fill) and counter[i]不为空:
            把carry合并到counter[i]
            交换carry与counter[i]
 
        # 此时carry已经合并了counter[0] 到 counter[i-1]的所有元素
        # 实际就是把carry的数据转交给下一层
        交换carry与counter[i]
        # 如果i == fill
        # 说明carry已经合并了counter[0] 到 counter[fill-1]的所有元素
        # 需要新增一层
        if i == fill:
            fill += 1
    # 所有元素处理完毕
    合并counter[0] 到 counter[fill-1]的所有元素
    将排序后的数据交换到list自身
这个过程关键还在于自己的理解。


Source URL:http://www.programlife.net/stl-list.html ,作者:代码疯子

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值