libc++ hashtable 源码简析

本文详细分析了libc++库中hashtable的实现,重点讨论了其链式结构和内存优化策略。hashtable采用单向链表连接元素,每个元素存储的是上一个元素的指针,形成一个左开右闭的区间。基类用于存储链表指针,减少内存占用。插入操作根据哈希值决定插入位置,并进行相应的头结点更新。删除操作则基于已缓存的哈希值进行。当元素数量超过负载因子时,进行扩容。
摘要由CSDN通过智能技术生成

libc++ hashtable 源码简析

本文分析的是 https://github.com/llvm-mirror/libcxx/ 中截止至 2016 年 1 月 30 日最新的 libc++
libc++ 中, hashtable 的实现为链式结构。 在教科书(Introduction To Algorithm 3rd Edition)中,介绍的实现是由一个数组作为buckets,每个数组中存储一个链表。但是 libc++ 中,使用一个单向链表贯穿整个 hashtable,每个 slot 存储的是上一个元素结点的指针,这个元素充当当前链表的头结点。也就是说,每个 slot 的链表存储的实际上是一个左开右闭的区间。在 libc++ 中,实现链表普遍使用了一个技巧:有一个基类 xxx_node_base,这个里面仅存储指向下一个(或者还有上一个)结点的指针,而真正的 xxx_node 里面才有元素。选用 xxx_node_base 作为头结点,这样就减少了单个元素的内存占用。在 hashtable 中,可以找到:

template <class _NodePtr>
struct __hash_node_base
{
    typedef __hash_node_base __first_node;

    _NodePtr    __next_;

    _LIBCPP_INLINE_VISIBILITY __hash_node_base() _NOEXCEPT : __next_(nullptr) {}
};

template <class _Tp, class _VoidPtr>
struct __hash_node
    : public __hash_node_base
             <
                 typename __rebind_pointer<_VoidPtr, __hash_node<_Tp, _VoidPtr> >::type
             >
{
    typedef _Tp value_type;

    size_t     __hash_;
    value_type __value_;
};

以下是 hashtable 的关键成员变量:

typedef unique_ptr<__node_pointer[], __bucket_list_deleter> __bucket_list;

// --- Member data begin ---
    __bucket_list                                     __bucket_list_;
    __compressed_pair<__first_node, __node_allocator> __p1_;
    __compressed_pair<size_type, hasher>              __p2_;
    __compressed_pair<float, key_equal>               __p3_;
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值