核心理论:Hash也称散列、哈希,对应的英文都是Hash。基本原理就是把任意长度的输入,通过Hash算法变成固定长度的输出。这个映射的规则就是对应的Hash算法,而原始数据映射后的二进制串就是哈希值。
Hash的特点:
- 从hash值不可以反向推出原始的数据。
- 输入数据的微小变化会得到完全不同的hash值,相同的数据会得到相同的值。
- 哈希算法的执行效率要高效,长的文本也能快速地计算出哈希值。
- hash算法的冲突概率要小。()
由于hash的原理是将输入空间的值映射成hash空间内,而hash值的空间远小于输入的空间。根据抽屉原理,一定会存在不同的输入被映射成相同输出的情况。
抽屉原理:桌上有十个苹果,要把这是个苹果放到九个抽屉里,至少有一个抽屉里面放不少于两个苹果。
HashMap的继承体系是什么样的?
Node<K,V>是HashMap里的一个静态内部类,Node<K,V>实现了Map.Entry<K,V>接口
Entry是Map接口中的一个接口
Node中有下面几个变量:
final int hash
插入的key的hash值,但它并不是hashcode,而是hashcode经过一次扰动得到的哈希值
final K key
put时存入的key
V value
map.put时存入的value
put到map中的数据都会封装成Node元素存放到散列表中
Node<K,V> next
下一个结点,链表
HashMap结构如下:
外层是一个Node数组,如果不指定长度,初始化时,默认长度是16,没有冲突时,只是一个数组,发生冲突时,在原来数组的冲突位会形成一个链表,当链表长度超过8,到达9并且当前的HashMap结构里数组长度超过64时,长度超过8个的链表结构就会升级成红黑树
put数据原理分析:
哈希表的长度一定是2的次方数
什么是Hash碰撞?会带来什么问题?
存入的Node对象经过hashcode和一次hash值扰动运算之后,计算出的存储位置上如果已经有元素了,已有元素的next结点就会指向新存入的Node元素,形成链表导致查找效率降低
Jdk8为什么引入红黑树?
为了解决Hash碰撞问题
HashMap的扩容原理
哈希表什么时候初始化?
第一次向put数据时初始化。