hashMap是著名的容器类,关于hashMap的种种问题也是面试必问题目之一,为了探求hashMap的本质,对其源码进行简单的阅读
首先是构造函数,可选的参数有4种,分别是无入参,入参为int ,入参为map,入参为int,float四种情况
入参为空时,构造函数将loadfactor设为0.75,loadfactor即加载因子,加载因子是表示Hsah表中元素的填满的程度.若:加载因子越大,填满的元素越多,好处是,空间利用率高了,但:冲突的机会加大了.反之,加载因子越小,填满的元素越少,好处是:冲突的机会减小了,但:空间浪费多了.
入参为int及int,float时,我们设定了hashmap的初始大小以及加载因子,通过初始大小获取threshold值,当hashmap大小达到threshold值时,会触发一次resize(),改变hashmap的值,所以在已知我们需要多大的hashmap时,最好在初始化时就输入,值得一提的是获取threshold的操作是位运算,方法代码为:
- static final int tableSizeFor(int cap) {
- int n = cap - 1;
- n |= n >>> 1;
- n |= n >>> 2;
- n |= n >>> 4;
- n |= n >>> 8;
- n |= n >>> 16;
- return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
- }
相当漂亮的算法,这个方法保证将threshold值设置为比初始大小更大的那个2的n次幂,比如说输入9就设为16,输入7就设为8
入参为map时,调用方法如下:
- final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
- int s = m.size();
- if (s > 0) {
- if (table == null) {
- float ft = ((float)s / loadFactor) + 1.0F;
- int t = ((ft < (float)MAXIMUM_CAPACITY) ?
- (int)ft : MAXIMUM_CAPACITY);
- if (t > threshold)
- threshold = tableSizeFor(t);
- }
- else if (s > threshold)
- resize();
- for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
- K key = e.getKey();
- V value = e.getValue();
- putVal(hash(key), key, value, false, evict);
- }
- }
- }
可以看到,根据传入map的大小设置了其threshold值,并将map放入,会预留至少map大小1.25倍以上的空间,当然是2的整数幂
构造函数的源码看完了,再看看hash最常用的两个方法get()和put()好了
可以看到put方法调用了putVal方法,真的是一个非常复杂的方法,我们仔细分析一下:
- final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
- boolean evict) {
- Node<K,V>[] tab; Node<K,V> p; int n, i;
- if ((tab = table) == null || (n = tab.length) == 0)
- n = (tab = resize()).length;
- if ((p = tab[i = (n - 1) & hash]) == null)
- tab[i] = newNode(hash, key, value, null);
- else {
- Node<K,V> e; K k;
- if (p.hash == hash &&
- ((k = p.key) == key || (key != null && key.equals(k))))
- e = p;
- else if (p instanceof TreeNode)
- e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
- else {
- for (int binCount = 0; ; ++binCount) {
- if ((e = p.next) == null) {
- p.next = newNode(hash, key, value, null);
- if (binCount >= TREEIFY_THRESHOLD - 1)
- treeifyBin(tab, hash);
- break;
- }
- if (e.hash == hash &&
- ((k = e.key) == key || (key != null && key.equals(k))))
- break;
- p = e;
- }
- }
- if (e != null) {
- V oldValue = e.value;
- if (!onlyIfAbsent || oldValue == null)
- e.value = value;
- afterNodeAccess(e);
- return oldValue;
- }
- }
- ++modCount;
- if (++size > threshold)
- resize();
- afterNodeInsertion(evict);
- return null;
- }
这里面的Node又是什么鬼?其实看到Node大家自然就会联想到链表对不对?这里定义了一个内部类,以链表的形式进行数据储存
可以看到get方法为: (本来应该接着写下去,但是最近在知乎看到一篇很漂亮的文章https://zhuanlan.zhihu.com/p/24338517,既然有珠玉在前,就不需要浪费口水了
- public V get(Object key) {
- Node<K,V> e;
- return (e = getNode(hash(key), key)) == null ? null : e.value;
- }