HashMap底层原理
- HashMap底层是哈希表/散列表的数据结构。
- 哈希表是怎样的数据结构呢?
- 哈希表是一个数组和单向链表的结合体
- 数组:在查询方面效率很高,随机增删方面效率很低
- 单向链表:在随机增删方面效率较高,在查询方面效率很低
小结:哈希表将以上的两种数据结构融合在一起,充分发挥它们各自的优点
- HashMap集合底层的源代码:
public class HashMap{
// HashMap底层实际上就是一个一维数组.(一维数组),数组中的基本元素就是Node。
transient Node<K,V>[] table;
// 静态内部类HashMap.Node
static class Node<K,V> implements Map.Entry<K,V>{
// 每一个Node结点包括
final int hash; //哈希值(哈希值是key的hashCode()方法的执行结果。hash值通过hash函 //数/算法,可以转换存储成数组的下标。)
final K key; // 存储到Map集合中的那个key
V value; // 存储到Map集合中的那个value
Node<K,V> next; // 下一个节点的内存地址。
}
}
note:上述代码只是列举了HashMap集合的部分组成结构,并未涉及哈希算法等深层次的东西!
哈希表/散列表: 一维数组,这个数组中每一个元素是一个单向链表。(数组和链表的结合体)
- 主要掌握**map.put(k,v)和v=map.get(k)**这两个方法的实现原理:
具体原理和哈希表的数据结构如图所示:
- HashMap集合的key部分特点:
-
无序,不可重复
- 为什么无序?
因为不确定存到哪一个单链表上
-
不可重复如何保证?
equals方法来保证HashMap集合的key不可重复,如果key重复了,value会覆盖。放在HashMap集合key部分的元素其实就是放到HashSet集合中了,所以HashSet集合中的元素也需要同时重写hashCode()+equals()方法。
- hashCode()方法需要重写,在重写时返回一个固定值可以吗?会出现什么问题?
- 会导致底层哈希表变成纯单向链表。这种情况我们称为: 散列分布不均匀。
- 什么是散列分布均匀?
- 假设有100个元素,10个单向链表,那么每个单向链表上有10个节点,这是最好的,是散列分布均匀的。
- hashCode()方法需要重写,在重写时返回一个不一样的值可以吗?会出现什么问题?
- 不行,这样导致底层哈希表就成为一维数组了,没有链表的概念了,也是散列分布不均匀。
- 散列分布均匀需要你重写hashCode()方法时有一定的技巧:应根据具体的业务需求具体确定!
- 哈希表ashMap使用不当无法发挥性能!
- 重点:放在HashMap集合key部分的元素,以及放在HashSet集合中的元素,需要同时重写hashCode和equals方法
- HashMap集合的默认初始化容量是16,默认加载因子是0.75:
- 这个默认加载因子是当HashMap集合底层数组的容量达到75%的时候,数组开始扩容
- 重点: HashMap集合初始化容量必须是2的倍数,这也是官方推荐的,这是因为达到散列均匀,为了提高HashMap集合的存取效率,所必须的。
- 向Map集合中存,以及从Map集合中取,都是先调用key的hashCode方法,然后再调用equals方法!(equals方法有可能调用,也有可能不调用)
- 拿put(k,v)举例,什么时候equals不会调用?
* k.hashCode()方法返回哈希值,
* 哈希值经过哈希算法转换成数组下标。
* 数组下标位置上如果是null,equals不需要执行
- 拿put(k,v)举例,什么时候equals不会调用?
* k.hashCode()方法返回哈希值,
* 哈希值经过哈希算法转换成数组下标。
* 数组下标位置上如果是null,equals不需要执行
- 注意:如果一个类的equals方法重写了,那么hashCode()方法必须重写:(两个方法都建议使用Idea自动生成)
并且equals方法返回true,hashCode()方法返回的值必须一样。equals方法返回true表示两个对象相同,在同一个单向链表上比较。那么对于同一个单向链表上的节点来说,他们的哈希值都是相同的。所hashCode()方法的返回值也应该相同。
- 终极结论: 放在HashMap集合key部分的,以及放在HashSet集合中的元素,需要同时重写hashCode方法和equals方法。
- 对于哈希表数据结构来说:
- 如果o1和o2的hash值相同,一定是放到同一个单向链表上
- 当然如果o1和o2的hash值不同,但由于哈希算法执行结束之后转换的数组下标可能不同,此时会发生**“哈希碰撞”**
- 在JDK8之后对哈希表做了相关的优化,如果哈希表单向链表中元素超过8个,单向链表会变成红黑树数据结构。当红黑树上的节点数量小于6时,会重新把红黑树变成单向链表数据结构。 这种方式也是为了提高检索效率,二叉树的检索会再次缩小扫描范围,提高效率!
note:
-
同一个单向链表上所有节点的hash值相同,因为他们的数组下标是一样的。
- 也有可能不同,我们将出现不同却在同一个节点的情况称为哈希碰撞
example:注意,哈希算法并不是一种固定的算法,而是一种思想,例如某哈希算法中存在求余操作:
7(哈希值)%3 = 1 4(哈希值)%3 = 1
虽然两个对象哈希值不同,但是也在同一个节点!我们称之为哈希碰撞!
-
但同一个链表上k和k的equals方法返回的是false,都不相等。
-
HashMap集合部分的key部分允许为null,但null值只能有一个(由map,put()方法的底层原理可得)
- HashTable的key和value都不能为null
-
JDK7及之前HashMap采用的是头插法,JDK8以后HashMap采用的是尾插法!