STL之hashtable
介绍
vector和list结合的方式。
几个需要熟记的点:
- 当空间足够的大的时候,可以直接用N=sizeof(T)*2的32次方,但是没有这么大的空间,所以通常是空间不足的。
- 空间不足就可能发生两个不同编号的元素除以整个空间的长度的余数在同一个位置上,这就是哈希碰撞
- 哈希碰撞解决办法:1,设计一个方程式,将这个发生碰撞的元素放到另外一个编号的位置上,但是这种方式消耗在计算方程式上的时间太多,而且还会发生哈希碰撞2,拉链法:如果发生碰撞,就让这个元素落在这个位置上的下面的链表中,这时候buckets存的是指针,而不是元素个数了。参照侯捷老师的PPT。
- 关于拉链法:单纯的通过链表来接着冲突的元素会有一个问题,链表的长度可能很长;很长的话就给他打散,当链表的长度比buckets的个数多的时候就需要打散,打散的方式是通过让buckets以倍数增长,但是这个buckets的大小刻意为质数,关于质数是因为每一个元素需要通过元素除以整个空间的长度的余数来求出要放置的位置,如果不是质数的话,比如都能被n整除,如果哈希表大小为M,M能够被n整除,那么n,n+M,n+2M…都会被映射到一个键中,也就是会发生哈希冲突。将M设置成质数会避免这种情况。
侯捷老师的PPT
部分源码
详情从参考注释
//说一下各个模板参数,HashFcn:每一个对象的编号(hashcode)是通过Hashfcn来得到的。ExtratKey:萃取出key,EqualKey:比较key
template<class Value,class Key,class HashFcn,class ExtractKey,class EqualKey,class Alloc=alloc>
class hashtable{
public:
typedef HasFcn hasher;
typedef EqualKey key_equal;
typedef size_t size_type;
private:
hasher hash;
key_equal equals;
ExtractKey get_key;
typedef _hashtable_node<Value>node;
vector<node*,Alloc>buckets;//桶
size_type num_elements;//表示现在有多少元素
public:
size_type bucket_count()const {return bucket.size();}
}
//node的结构,普通的单向链表结构
template<class Value>
struct _hashtable_node{
_hashtable_node*next;//指向下一个节点的指针
Value val;//数据
};
//迭代器要有能力从节点回到篮子里找到下一个篮子
template<class Value,class Key,class HashFcn,class ExtractKey,class EqualKey,class Alloc=alloc>
struct _hashtable_iterator{
...
node*cur;//
hashtable*ht;//一个指向hashtable本身的指针
};
哈希冲突
不写使用这个玩意了,,我没用过。。
参考:侯捷老师STL讲解
书本:《STL源码刨析》