HashMap
HashMap 是一个散列表,通过 key 可以得到 value 的值 存储时都是用(key,value)形式
它是由数组和链表组合构成的数据结构
数组里存在Key-Value这样的实例,在Java7叫 Entry 在Java8中叫Node。
本身所有的位置都为null,在put插入的时候会根据key的hash去计算一个index值
数组容量是有限的,数据多次插入的,到达一定的数量就会进行扩容,也就是resize
什么时候resize呢?
- Capacity:HashMap当前长度。
- LoadFactor:负载因子,默认值0.75f
插入节点之后元素的数量大于Capacity*LoadFactor
它是怎么扩容的呢?
- 扩容:创建一个新的Entry空数组,长度是原数组的2倍。
- ReHash:遍历原Entry数组,把所有的Entry重新Hash到新数组。
为什么要重新Hash呢,直接复制过去不行吗?
因为长度扩大以后,Hash的规则也随之改变
Hash的公式—> index = HashCode(Key) & (Length - 1)
为什么需要链表?
数组长度是有限的,在有限的长度里面我们使用哈希,哈希本身就存在概率性,极端情况不同 key hash到一个值上
如果哈希冲突,新的节点是如何插入到链表中?
java8之前是头插法:就是说新来的值会取代原有的值,原有的值就顺推到链表中去
在java8之后,都是用尾部插入
为啥之前用头插法,java8之后改成尾插了呢?
如之前数组有一个位置有个链表 A->B
扩容之后,可能A,B两个元素又在同一index
A先处于index的位置,之后头插使B指向A,变成了 B->A ,也就是说扩容转移后前后链表顺序倒置
发现A指向B,B指向A ,如果查找该index不存在的元素,会进入死循环
如果采用尾插,那么A先处于index的位置,之后头插使尾插使A指向B,链表的位置不改变
那是不是意味着Java8就可以把HashMap用在多线程中呢?
不可以,因为put/get方法都没有加同步锁
多线程情况最容易出现的就是:无法保证上一秒put的值,下一秒get的时候还是原值,所以线程安全还是无法保证。
HashMap的默认初始化长度是多少?为什么?
16
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // 位与运算比算数计算的效率高了很多
在创建HashMap的时候, 最好赋初值,而且最好是2的幂,提高计算的效率
我们怎么尽可能的得到一个均匀分布的hash呢?
index = HashCode(Key) & (Length - 1)
Length - 1 = 15 十进制15其二进制为1111
index 最后 & 运算之后,得到的是 HashCode(Key)二进制最后的四位数
所以说
默认初始长度为16还可以实现均匀分布
HashCode的规则是什么?
public static int hashCode(int value){
return value ;
}
public static int hashCode(float value){
return floatToIntBits(value) ;
}
long和double 前32与后32 ^ 运算 value ^ (value >>> 32)
字符串
31是一个奇素数,JVM会将 31 * i 优化成 ( i <