__mt_alloc源码分析(1)

本文从源代码级别研究mt allocator的内部实现,使用GCC 4.1.2版本的源码,主要源文件为库文件<ext/mt_allocator.h>GCC源码中的“libstdc++-v3/src/ mt_allocator.cc”。

假定读者对mt allocator的原理已有一定的了解。

 

class __mt_alloc

为避免一开始就深入到复杂的内存分配机制里,我采用从上往下的研究方法。最顶层自然是提供给用户使用的__mt_alloc类:

 

611    template<typename _Tp,

612        typename _Poolp = __common_pool_policy<__pool, __thread_default> >

613      class __mt_alloc : public __mt_alloc_base<_Tp>

 

每行代码前面都加注了所在的行号,方便查阅。如果没有特别注明文件名,所有的代码都摘自<ext/mt_allocator.h>

__mt_alloc2个模板参数,_Tp是管理的对象类型,_Poolp是所用的内存池策略。stl里实现的可用与__mt_alloc的内存池策略有2个,__common_pool_policy__per_type_pool_policy,前者对所有的_Tp类型一视同仁,后者会区别对待每个_Tp类型,这在后面详细研究。__mt_alloc的基类是__mt_alloc_base

根据stl标准,每个allocator都要定义几个固定的typedef类型:

 

616        typedef size_t                       size_type;

617        typedef ptrdiff_t                    difference_type;

618        typedef _Tp*                         pointer;

619        typedef const _Tp*                  const_pointer;

620        typedef _Tp&                         reference;

621        typedef const _Tp&                  const_reference;

622        typedef _Tp                          value_type;

 

__mt_alloc还多出来2个:

 

623        typedef _Poolp                 __policy_type;

624        typedef typename _Poolp::pool_type    __pool_type;

 

__policy_type__mt_alloc采用的内存池策略,而__pool_type则是内存池的类型。

rebind嵌套类也是stl标准规定的allocator成员之一,目的在于把对T1allocator重绑定到T2上。由于__mt_alloc2个模板参数,所以它的rebind类也有2个参数。只要你能看懂模板参数的推导,就能看懂rebind的定义。

__mt_alloc的公有成员函数接口相比stl标准的allocator也多出2个,

 

648        const __pool_base::_Tune

649        _M_get_options()

650        {

651     // Return a copy, not a reference, for external consumption.

652     return __policy_type::_S_get_pool()._M_get_options();

653        }

654       

655        void

656        _M_set_options(__pool_base::_Tune __t)

657        { __policy_type::_S_get_pool()._M_set_options(__t); }

658      };

 

分别是得到__mt_alloc的配置参数和设置配置参数。注意设置函数_M_set_options必须在任何内存分配动作之前调用,因为第一次调用allocate()的时候__mt_alloc会进行一次参数初始化,如果你在初始化之后再_M_set_options,不会有任何效果。

所有成员函数里,最重要的就是allocatedeallocate

allocate

660    template<typename _Tp, typename _Poolp>

661      typename __mt_alloc<_Tp, _Poolp>::pointer

662      __mt_alloc<_Tp, _Poolp>::

663      allocate(size_type __n, const void*)

 

这是allocate函数的原型,参数__n是要分配的对象的个数。

 

664      {

665        if (__builtin_expect(__n > this->max_size(), false))

666     std::__throw_bad_alloc();

 

__builtin_expectgcc的内建函数,原型是:long __builtin_expect(long exp, long c)。其第一个参数exp为一个整型表达式,这个内建函数的返回值也是这个exp,而c为一个编译期常量。这个函数的语义是:你期望exp表达式的值等于常量c,从而GCC为你优化程序,将符合这个条件的分支放在合适的地方。

max_size()函数返回“size_t(-1) / sizeof(_Tp)”,这个值在正常的运行情况下显然比__n大,所以这里用__builtin_expect进行一些优化。

 

668        __policy_type::_S_initialize_once();

 

这里就是__mt_alloc初始化配置参数的地方。从函数名字可以看出来,初始化工作只会进行一次。 _S_initialize_once属于__policy_type,在后面进行研究。

 

670        // Requests larger than _M_max_bytes are handled by operator

671        // new/delete directly.

672        __pool_type& __pool = __policy_type::_S_get_pool();

673        const size_t __bytes = __n * sizeof(_Tp);

674        if (__pool._M_check_threshold(__bytes))

675     {

676       void* __ret = ::operator new(__bytes);

677       return static_cast<_Tp*>(__ret);

678     }

 

得到内存池对象,计算实际需要的内存字节数__bytes,然后检查__bytes是否大于一个阀值。__mt_alloc默认对于128字节以上的内存块,直接调用newdelete进行分配和释放。这个阀值是可以配置的。

 

680        // Round up to power of 2 and figure out which bin to use.

681        const size_t __which = __pool._M_get_binmap(__bytes);

682        const size_t __thread_id = __pool._M_get_thread_id();

 

如果__bytes在阀值以内,那么首先找出它对应的bin索引。由于__mt_alloc只处理2的指数字节的内存块,所以对于其他的数值也要上调至2的指数,然后交给对应的bin来处理。_M_get_binmap使用一个长度为128(可配置)的数组,把字节数映射到bin的索引。__mt_alloc处理的最小的内存块默认为8字节(可配置),于是__mt_alloc总共有5bin,分别对应8163264128字节。这里__which的取值为04,取决于__bytes的大小。

为了在多线程之间管理内存,__mt_alloc给每个线程分配了一个线程id。不同于OS分配的线程id__mt_alloc分配的线程id取值从14096(默认,可以配置),而且可以回收和重新分配给新线程,id0保留给全局使用,不分配给任何线程。_M_get_thread_id函数负责给当前线程分配新的线程id,如果已有,那么直接返回这个id

 

684        // Find out if we have blocks on our freelist.  If so, go ahead

685        // and use them directly without having to lock anything.

686        char* __c;

687        typedef typename __pool_type::_Bin_record _Bin_record;

688        const _Bin_record& __bin = __pool._M_get_bin(__which);

 

由前面算出的__which,得到bin对象引用。

 

689        if (__bin._M_first[__thread_id])

 

每个bin都要维护4097个空闲块链表,其中__thread_id=0对应的是全局的空闲块链表,其他__thread_id对应线程自己的空闲块链表。这些链表的首地址存放在_M_first数组里,自然它的长度是4097。线程向__mt_alloc申请内存块时,首先检查自己的空闲块链表是否有元素,这通过判断_M_first[__thread_id]是否为NULL来完成。

 

690     {

691       // Already reserved.

692       typedef typename __pool_type::_Block_record _Block_record;

693       _Block_record* __block = __bin._M_first[__thread_id];

694       __bin._M_first[__thread_id] = __block->_M_next;

 

如果线程自己的空闲链表有元素,那么取出来到__block里,然后让链表头指向下一个块(如果有的话)。

 

696       __pool._M_adjust_freelist(__bin, __block, __thread_id);

 

在单线程情况下,_M_adjust_freelist什么事情都不做。在多线程情况下,_M_adjust_freelist负责调整_M_free_M_used计数器,然后设置__block_M_thread_id为当前线程的__thread_id

 

697       __c = reinterpret_cast<char*>(__block) + __pool._M_get_align();

 

准备把__block返回给用户。注意用户得到的并不是指向__block的指针,而是加上了一个_M_get_align(),默认情况下返回值为8,表示__block与实际数据区的距离。跳过前面_M_adjust_freelist设置的_M_thread_id,这是每个块都要记录的信息,要保留到deallocate的时候使用。

 

698     }

699        else

700     {

701       // Null, reserve.

702       __c = __pool._M_reserve_block(__bytes, __thread_id);

 

如果线程自己的空闲链表没有有元素,就向内存池申请。_M_reserve_block里的详细内容在后面研究。

 

703     }

704        return static_cast<_Tp*>(static_cast<void*>(__c));

 

最后返回给用户申请到的内存的指针。

 

705      }

 

deallocate

内存块的释放过程与分配过程基本相反,__mt_alloc里实现的代码也比较简单,当然,复杂的内幕都交给内存池去处理了。

 

707    template<typename _Tp, typename _Poolp>

708      void

709      __mt_alloc<_Tp, _Poolp>::

710      deallocate(pointer __p, size_type __n)

 

这是deallocate的函数原型,参数__p为要释放的对象首地址,__n为对象的个数。

 

711      {

712        if (__builtin_expect(__p != 0, true))

713     {

 

显然在多数情况下,__p != 0是成立的。如果__p0,那么deallocate什么都不需要做。

 

714       // Requests larger than _M_max_bytes are handled by

715       // operators new/delete directly.

716       __pool_type& __pool = __policy_type::_S_get_pool();

717       const size_t __bytes = __n * sizeof(_Tp);

718       if (__pool._M_check_threshold(__bytes))

719         ::operator delete(__p);

720       else

721         __pool._M_reclaim_block(reinterpret_cast<char*>(__p), __bytes);

722     }

723      }

 

接下来的代码都很容易理解,计算总共的字节数,检查是否超过了阀值。如果是则用delete释放内存,否则使用_M_reclaim_block归还给内存池。_M_reclaim_block的具体实现在后面研究。

 

class  __mt_alloc_base

__mt_alloc_base __mt_alloc的基类,也许你认为它应该处理了所有__mt_alloc遗留下来的“难题”,但是结果可能令你失望:__mt_alloc_base其实异常简单,连我在初次见到它是时候都有点吃惊。

 

560    /// @brief  Base class for _Tp dependent member functions.

 

这句话定位了__mt_alloc_base的角色,它只处理与_Tp有关的一些成员函数。

 

561    template<typename _Tp>

562      class __mt_alloc_base

563      {

564      public:

565        typedef size_t                    size_type;

566        typedef ptrdiff_t                 difference_type;

567        typedef _Tp*                      pointer;

568        typedef const _Tp*                const_pointer;

569        typedef _Tp&                      reference;

570        typedef const _Tp&                const_reference;

571        typedef _Tp                       value_type;

 

这是基本的typedef类型,与__mt_alloc里的完全一样。

 

573        pointer

574        address(reference __x) const

575        { return &__x; }

576 

577        const_pointer

578        address(const_reference __x) const

579        { return &__x; }

580 

581        size_type

582        max_size() const throw()

583        { return size_t(-1) / sizeof(_Tp); }

 

__mt_allocallocate函数里调用的的max_size()就是这个函数。

 

585        // _GLIBCXX_RESOLVE_LIB_DEFECTS

586        // 402. wrong new expression in [some_] allocator::construct

587        void

588        construct(pointer __p, const _Tp& __val)

589        { ::new(__p) _Tp(__val); }

 

使用placement new操作符在__p指向的内存上建立起值为__val _Tp对象。

 

591        void

592        destroy(pointer __p) { __p->~_Tp(); }

593      };

 

stl里,allocator的一个重要特点就是把内存分配与对象构造区分开来,同时也区分了内存释放与对象析构。函数constructdestroy分别负责构造和析构对象,而allocatedeallocate分别负责分配和释放内存。

 

class __common_pool_policy

虽然只是__mt_alloc的一个模板参数,但是它的意义远大于__mt_alloc_base。当然,__common_pool_policy也不是真正的“幕后主角”,它的作用只是提供_M_rebind,给__mt_alloc::rebind使用。

 

450    /// @brief  Policy for shared __pool objects.

451    template<template <bool> class _PoolTp, bool _Thread>

452      struct __common_pool_policy : public __common_pool_base<_PoolTp, _Thread>

 

模板参数_PoolTp是真正的内存池,_Thread表示是否需要多线程支持。

 

453      {

454        template<typename _Tp1, template <bool> class _PoolTp1 = _PoolTp,

455            bool _Thread1 = _Thread>

 

由于_M_rebind只在__mt_alloc::rebind里使用过,而且只使用了第一个模板参数_Tp1,所以后2个模板参数其实只是为了与__common_pool_policy自己的定义“兼容”,所以这里用了默认值。

 

456          struct _M_rebind

457          { typedef __common_pool_policy<_PoolTp1, _Thread1> other; };

 

other的类型其实只与_PoolTp1_Thread1有关,所以_Tp1模板参数虽然是__mt_alloc::rebind唯一关心的东西,但是到了这里,却发现毫无用处。其实整个_M_rebind都是毫无用处的,如果你回头看__mt_alloc::rebind定义的629行,就会发现pol_type其实就是_Poolp1自己,因为模板参数_Tp1_M_rebind里根本就没有用到过。

 

459        using  __common_pool_base<_PoolTp, _Thread>::_S_get_pool;

460        using  __common_pool_base<_PoolTp, _Thread>::_S_initialize_once;

 

2using的作用我也不太清楚,可能只是为了强调一下吧。因为_S_get_pool_S_initialize_once在基类里本来就是公有的,所以即使去掉这2using语句也可以。

 

461    };

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值