HashMap是Map体系中最常用的一个集合。
HashMap的特点
1.HaspMap是Map里面的一个实现类。
2.没有额外需要学习的特有方法,直接使用Map里面的方法
3.特点都是由键决定:无序、不重复、无索引
4.HaspMap跟HashSet底层原理一模一样,都是哈希表结构
HashMap底层原理
当创建一个Hash对象时,默认会创建一个长度为16,默认加载因子为0.75的数组。
null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
利用put方法就可以创建数据,put方法底层会创建一个Entry<V,V>对象,然后利用键去计算一个哈希值(这里使用键计算,跟值没有任何关系!!!!)
比如说:计算出来的值时5
null | null | null | null | null | value | null | null | null | null | null | null | null | null | null | null |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
加入再put进来一个值,它计算的结果也是5:处理方式会有两种
1.当计算出来的数组位置为null是,会直接添加到对应的位置中
2.当计算出来的数组位置已经有值时,【JDK8开始时】把新添加的元素直接挂在老元素下面形成新的链表。就是下面这种情况:
额外还有一个条件:为了提高性能,当链表长度超过8或者数组长度大于等于64时,链表自动转成红黑树:
小结:
1.HashMap底层时哈希表结构的
2.依赖hashCode方法和equals方法保证键的唯一性
3.如果键存储的时自定义对象,需要重写hashCode和equals方法;如果值存储自定义对象,不需要重写hashCode和equals方法
源码解析搞懂HashMap
加载因子:加载因子是HashMap中的一个重要参数,它表示哈希表在何时进行扩容操作。
1.先看我们创建一个HashMap会进行什么操作
HashMap<String,String>hm=new HashMap<>();
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; //1.创建hashMap时初始化数组的大小为16
static final int MAXIMUM_CAPACITY = 1 << 30; //数组的最大容量
static final float DEFAULT_LOAD_FACTOR = 0.75f;//默认的加载因子为0.75
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR;
}
//默认空参构造方法默认初始化加载因子为0.75
//此时底层数组还没有创建
当使用put方法的时候会创建数组
hm.put("英雄","马超");
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);//调用了putVal方法
//第一个参数计算哈希值
//第二个参数是键
//第三个参数是值
//第四个参数是表明键值相同时,当前数据是否保留,false表示重复数据不保留,会覆盖
}
先看putVal第一个参数hash(Key)
//可以看到这里时计算键的哈希值,当键为null的时候返回0,键值不为null的时候,计算键的哈希值
//这里也证明一点 哈希值计算只跟键有关,和值没有任何关系
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
第一种情况.数组位置为Null,首次添加
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; //定义一个局部变量用来计算哈希表数组的地址值
Node<K,V> p; //临时的第三方变量,用来记录键值对对象的地址值
int n; //记录当前数组的长度
int i;//记录索引
tab=table;//把哈希表中的数组值,赋值给局部变量tab
if (tab== null || (n = tab.length) == 0)
//如果当前是第一次添加数据,则会创建一个默认长度为16,加载因子为0.75的数组
//如果不是第一次添加数据,会看数组中的元素是否达到了扩容的条件
tab = resize();
n =tab.length;
i = (n - 1) & hash;//数组的长度跟键的哈希值进行计算,计算出当前键值对对象,在数组中应该存入的位置
p = tab[i];//获取到数组中的元素
if (p == null)//第一次添加数据的话,首次就是null,创建一个新的键值对对象,并且其存入tab[i]
tab[i] = newNode(hash, key, value, null);
else {//首次创建不会走else操作
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;//并发修改异常有关,暂时不需要了解
//threshold=数组的长度*0.75 哈希表的扩容实际, ++size 先添加在判断
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;//首次添加的话,就表明当前添加没有覆盖任何元素,直接返回
}
resize()函数解析
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table;//首次添加的话是null,赋值给OldTab
int oldCap = (oldTab == null) ? 0 : oldTab.length; //oldCap代表旧的容capacity 首次设置为0 首次初始化因为oldCap为0所以直接跳转到else
int oldThr = threshold;//旧的扩充时机
int newCap;//初始化新的容量
int newThr = 0;
if (oldCap > 0) {//非首次添加 从上面的putVal的代码中
//if (++size > threshold) resize(); //当达到扩容条件 扩容条件为12
if (oldCap >= MAXIMUM_CAPACITY) {//这里大于最大容量,我们先看正常添加不超过的情况
threshold = Integer.MAX_VALUE;
return oldTab;
}
//newCap = oldCap << 1 新的容量扩充为老容量的2倍,在判断是否满足小于MAXIMUM_CAPACITY最大容量,然后老容量同时也大于最大的阈值
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; //把阈值设置为原来的两倍就是24 假设原来12
}
else if (oldThr > 0)
newCap = oldThr;
else {//首次初始化
newCap = DEFAULT_INITIAL_CAPACITY;//首次加载默认初始化的容量为16
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);//默认的扩充时机为加载因子*16=12
}
if (newThr == 0) {//阈值为0,刚开始创建时,为新阈值赋值=加载因子0.75*新容量16
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; //首次会创建一个长度为16的数组
table = newTab;//新创建的数组赋值给成员变量tab
//第一次添加的话就不会走下面
//当将旧的数组内容存到新的数组中去
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else { // preserve order
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;//把新的数组返回
}
第二种情况:数组位置不为Null,键不重复,挂在下面形成链表或者红黑树
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; //定义一个局部变量用来计算哈希表数组的地址值
Node<K,V> p; //临时的第三方变量,用来记录键值对对象的地址值
int n; //记录当前数组的长度
int i;//记录索引
tab=table;//把哈希表中的数组值,赋值给局部变量tab
if (tab== null || (n = tab.length) == 0) //这里的tab不是null,所以把n=tab.length
//如果当前是第一次添加数据,则会创建一个默认长度为16,加载因子为0.75的数组
//如果不是第一次添加数据,会看数组中的元素是否达到了扩容的条件
tab = resize();
n =tab.length;
i = (n - 1) & hash;//数组的长度跟键的哈希值进行计算,计算出当前键值对对象,在数组中应该存入的位置
p = tab[i];//获取到数组中的元素
if (p == null) //当前不是Null,所以会走else的代码
tab[i] = newNode(hash, key, value, null);
else {//数组位置不为null
Node<K,V> e;
K k;//存放键
//p.hash==hash 这里是键不重复,所以当前if不会走
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode) //判断当前节点是不是红黑树的节点,如果是的话,就会按照红黑树的规则添加 [当链表长度超过8或者数组长度大于等于64时,链表自动转成红黑树:]
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {//按照链表的规则添加
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {//查看当前节点的下面的节点是不是null。若是则走下面
//创建一个新的节点挂在下面形成链表
p.next = newNode(hash, key, value, null);
//判断长度是否超过8,然后进一步判断下面的函数是否转为红黑树
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;//如果为Null的话,直接跳出
}//下面因为键不相同所以不会走
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;//相当于p=p.next 因为上面的e=p.next,也就是或找到一个链表下面不挂节点的节点,把新节点放再其下面
}
}
if (e != null) { //这里e不是Null
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;//并发修改异常有关,暂时不需要了解
//threshold=数组的长度*0.75 哈希表的扩容实际, ++size 先添加在判断
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;//首次添加的话,就表明当前添加没有覆盖任何元素,直接返回
}
第三种情况:数组位置不为Null,键重复,元素覆盖
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; //定义一个局部变量用来计算哈希表数组的地址值
Node<K,V> p; //临时的第三方变量,用来记录键值对对象的地址值
int n; //记录当前数组的长度
int i;//记录索引
tab=table;//把哈希表中的数组值,赋值给局部变量tab
if (tab== null || (n = tab.length) == 0) //这里的tab不是null,所以把n=tab.length
//如果当前是第一次添加数据,则会创建一个默认长度为16,加载因子为0.75的数组
//如果不是第一次添加数据,会看数组中的元素是否达到了扩容的条件
tab = resize();
n =tab.length;
i = (n - 1) & hash;//数组的长度跟键的哈希值进行计算,计算出当前键值对对象,在数组中应该存入的位置
p = tab[i];//获取到数组中的元素
if (p == null) //当前不是Null,所以会走else的代码
tab[i] = newNode(hash, key, value, null);
else {//数组位置不为null
Node<K,V> e;
K k;//存放键
//p.hash==hash
这里是键是重复的,值是不一样的
这里有两种情况
1.要添加的是(aaa,555) 添加位置的数组第一个位置元素为(aaa,666),这里的话直接走if语句,然后把p赋值给e;
2.情况2就是链表中有好多元素,但是其中链表中的其中一个元素(非第一个)和要添加的元素的哈希值一样并且键也一样,也要尽心覆盖操作,走下面的else if/else操作
//p.hash代表的是数组中键值堆的哈希值,hash代表要添加的键值对的哈希值
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode) //判断当前节点是不是红黑树的节点,如果是的话,就会按照红黑树的规则添加 [当链表长度超过8或者数组长度大于等于64时,链表自动转成红黑树:]
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {//按照链表的规则添加
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {//查看当前节点的下面的节点是不是null。若是则走下面
//创建一个新的节点挂在下面形成链表
p.next = newNode(hash, key, value, null);
//判断长度是否超过8,然后进一步判断下面的函数就是转为红黑树
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;//直接跳出
}
//因为是第三种情况,所以这里的键是一样的,但是值不一样
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;//所以把e赋值给p
}
}
if (e != null) { //这里e不是Null
V oldValue = e.value; //把当前的值复制给oldValue
if (!onlyIfAbsent || oldValue == null)//要进行覆盖操作
e.value = value;//直接把当前值替换为value
afterNodeAccess(e);
return oldValue;//返回覆盖前的值
}
}
++modCount;//并发修改异常有关,暂时不需要了解
//threshold=数组的长度*0.75 哈希表的扩容实际, ++size 先添加在判断
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;//首次添加的话,就表明当前添加没有覆盖任何元素,直接返回
}