前言
HashMap构建的部分算是看的差不多了,但是后面还有扩容的部分还没怎么理解,先用把大佬们的文章放在这里,如有侵权,立马删除.
概要
HashMap不是线程安全,其底层的实现是数组,链表和红黑树。且允许key,value为null
其包的继承结构如下:
原理
可以看到,HashMap中主要是三种结构:
(1)数组,在源码中对应的是Table的部分
(2)链表,当冲突数大于8的时候,且表的长度<64的时候,进行扩容,当表的长度>64时将其转化为红黑树.
(3)红黑树
源码
1.注意其中使用了(tab=table) == ?这样的操作
2.第二个注释的地方,使用了i = (n - 1) & hash]这种操作,这在n为2的n次方的情况下就是hash%n;也就是对整个数组大小取余
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
//如果当前数组为空或者为null,进行扩容
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
//如果要插入的key值在table中没有存储过,则创建节点,将其存储
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
//判断是否为数组中的节点
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
//判断是否为树节点
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
//判断是否为链表节点
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
//如果发现经过上面的操作插入了节点,跳出
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
//如果数组的大小超过阈值,进行扩容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
流程
同族生物
- HashSet
其底层实现就是使用的HashMap.特点是:允许有null值,不保证set的访问顺序,因此只能通过迭代的方式进行。
- LinkedHashSet
底层实现也是HashMap,但是其通过accessOrder = false,设定插入时必须要保证顺序。
- TreeSet
底层是TreeMap,底层也是借助了HashMap
面试题
1.HashTable与HashMap之间的区别
- HashTable是线程安全的,其通过synchronized实现线程同步,HashMap不是
- HashTable不允许key,value值为null,HashMap可以
2.如果HashMap的大小超过了负载因子(load factor)定义的容量,怎么办?
- 将HashMap进行扩容,扩容为2倍
3.HashMap的长度为什么是2的倍数?
- 在长度为2的n次方的情况下,%运算可以转化为&,从而加快计算的速度.
4.你了解重新调整HashMap大小存在什么问题吗?
- 会产生条件竞争,因为没有synchronized关键词的情况下,当有多个线程同时发现HashMap需要调整的时候,由于线程1想要进行的时候,就被挂起。等到线程1继续执行的时候,线程2已经将HashMap调整好了,此时线程1再次执行,将HashMap调整到了错误的方向。详情可以看这篇文章。
5.ConcurrentHashMap和Hashtable的区别
ConcurrentHashMap与HashTabel基本相同,但是ConcurrentHashMap会根据同步级别对map的一部分进行加锁,从而提高了效率。
6.当两个对象的hashcode相同会发生什么?
这里的hashcode,其实就是上面第二个注释的部分,也就是通过hash函数生成的hash码。
如果两个hashcode相同,就会按照上面的方式进行存储
7.如果两个键的hashcode相同,你如何获取值对象?
直接来看源码,分为三步
- 判断是不是数组中的元素,也就是根节点
- 判断是不是树节点,如果是调用树的查询
- 最后在hashcode相同的情况下,通过key.equals判断到底是那个元素
final Node<K,V> getNode(int hash, Object key) {
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
return first;
if ((e = first.next) != null) {
if (first instanceof TreeNode)
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
do {
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}
8.解决Hash冲突的方法?
- 开放定址法
- 链地址法
- 公共溢出区法
专门开辟存储空间,用来存放冲突的数据,用于数据比较少的情况 - 再散列法