似乎所有的java面试或者考察都绕不开hash,准确说是必问集合,问集合必问hash表。
虽然一直以来都经常的使用HashMap,但是却一直没有看过源码,可能是没有意识到阅读源码的好处,经过分析,发现阅读源码让自己对集合有了更加深刻的了解,因此会一直将这个系列进行下去,这次要说的是HashMap。
HashMap的基本概况
HashMap是一个Hash表,其数据以键值对的结构进行存储,在遇到冲突的时候会使用链表来进行解决,JDK8以后引入了红黑树的模式,具体会在文中分析。
其次,HashMap是非线程安全的,Key和Value都允许为空,Key重复会覆盖、Value允许重复。
补充一句,在多线程下我们可以使用concurrentHashMap。
HashMap和Hashtable的区别:
(HashMap和Hashtable)
HashMap定义
public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable
HashMap没有什么要说的,直接切入正题,初始化一个HashMap。
初始化
HashMap map = new HashMap();
通过这个方法会调用HashMap的无参构造方法。
//两个常量 向下追踪
public HashMap() {
this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);
}
//无参构造创建对象之后 会有两个常量
//DEFAULT_INITIAL_CAPACITY 默认初始化容量 16 这里值得借鉴的是位运算
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
//DEFAULT_LOAD_FACTOR 负载因子默认为0.75f 负载因子和扩容有关 后文详谈
static final float DEFAULT_LOAD_FACTOR = 0.75f;
//最大容量为2的30次方
static final int MAXIMUM_CAPACITY = 1 << 30;
//以Node<K,V>为元素的数组,长度必须为2的n次幂
transient Node<K,V>[] table;
//已经储存的Node<key,value>的数量,包括数组中的和链表中的,逻辑长度
transient int size;
threshold 决定能放入的数据量,一般情况下等于 Capacity * LoadFactor
通过上述代码我们不难发现,HashMap的底层还是数组(注意,数组会在第一次put的时候通过 resize() 函数进行分配),数组的长度为2的N次幂。
在HashMap中,哈希桶数组table的长度length大小必须为2的n次方(一定是合数),这是一种非常规的设计,常规的设计是把桶的大小设计为素数。
相对来说素数导致冲突的概率要小于合数,Hashtable初始化桶大小为11,就是桶大小设计为素数的应用(Hashtable扩容后不能保证还是素数)。
HashMap采用这种非常规设计,主要是为了在取模和扩