1. HashMap的底 层实现,HashSet的底层实现
HashMap在JDK1.8之前是数组+链表,JDK1.8之后 是数组+链表/红黑树
HashSet的底层是HashMap
2. HashMap的put方 法的底层原理
1.根据key的hashCode计算出数组index
2.落槽时
1.如果数组中节点为null,创建新的节点对象,把k,v存储在节点对象中,把节点对象存储在数组中
2.如果数组的节点不为nu1l,判断节点的key与插入元素的key是否相等
1.相等,直接用新的k, v覆盖原节点中的k,v
2.不相等,判断此时节点是否为红黑树
1.是红黑树,创建红黑树节点对象存储k,v,插入到红黑树中
2.不是红黑树,创建链表节点对象存储k,v,插入到链表中,判断链表长度是否大于阈值8
1.大于阈值8,链表转换为红黑树
3.判断++size是否大于阈值,是就扩容
3. HashMap的resize()扩容方法的底层原理
HashMap默认初始容量是16
resize()方法是在hashmap中的size大于阈值时或者初始化时,就调用resize方法进行扩 容
每次扩容的时候始终是原数组长度的2倍,即长度永远是2的n次方
扩容后节点对象的位置要么在原位置,要么偏移到两倍的位置
4. HashMap 的长度为什么是2的幂次方
为了能让HashMap 存取高效,尽量较少碰撞,也就是要尽量把数据分配均匀,每个链表/红黑树长度大致相同。这个实现就是把数据存到哪个链表/红黑树中的算法。
5.什么是哈希函数和哈希码
Hash,一般翻译为“散列”,也有直接音译为“哈希”的,这就是把任意长度的输入通过散列算法,变换成固定长度的输出,该输出就是散列值(哈希值);这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
所有散列函数都有如下一个基本特性:根据同一散列函数计算出的散列值如果不同,那么输入值肯定也不同。但是,根据同一散列函数计算出的散列值如果相同,输入值不一定相同。
6.什么是哈希碰撞/哈希冲突,怎么解决哈希冲突,HashMap采用的是什么策略
当两个不同的输入值,根据同一散列函数计算出相同的散列值的现象,我们就把它叫做哈希冲突(哈希碰撞)。
- 使用拉链法(使用链表)来链接拥有相同hash值的数据;
- 使用新hash函数(2次扰动函数)来降低哈希冲突的概率,使得数据分布更平均;
- 引入红黑树进一步降低遍历的时间复杂度,使得遍历更快;
7. HashMap和TreeMap的区别
1、HashMap是通过hashcode()对其内容进行快速查找的;HashMap中的元素是没有顺序的;
TreeMap中所有的元素都是有某一固定顺序的,如果需要得到一个有序的结果,就应该使用TreeMap;
2、HashMap和TreeMap都不是线程安全的;
3、HashMap继承AbstractMap类;覆盖了hashcode() 和equals() 方法,以确保两个相等的映射返回相同的哈希值;
TreeMap继承SortedMap类;他保持键的有序顺序;
4、HashMap:基于hash表实现的;使用HashMap要求添加的键类明确定义了hashcode() 和equals() (可以重写该方法);为了优化HashMap的空间使用,可以调优初始容量和负载因子;
TreeMap:基于红黑树实现的;TreeMap就没有调优选项,因为红黑树总是处于平衡的状态;
5、HashMap:适用于Map插入,删除,定位元素;
TreeMap:适用于按自然顺序或自定义顺序遍历键(key);
8.如何决定使用HashMap 还是TreeMap ?
对于在Map中插入、删除和定位元素这类操作,HashMap是 最好的选择。然而,假如你需要对一个有序的key集合进行遍历,TreeMap是 更好的选择。基于你的collection的大小,也许向HashMap中 添加元素会更快,将map换为TreeMap进行 有序key的遍历