HashMap的使用及其实现

本文详细介绍了HashMap在Java中的应用和实现原理,包括其基于哈希表的非同步特性,允许存储null值,以及数组+链表+红黑树的存储结构。当链表长度超过8时,HashMap会转换为红黑树以提高查找效率。文章还探讨了HashMap的源码,包括其构造、存储和读取过程,以及扩容机制和线程安全问题。并对比了HashMap与Hashtable的区别,如线程安全性、提供的方法和对null值的支持等。
摘要由CSDN通过智能技术生成

1.概述

HashMap可以说是在java中应用最频繁Map类型了。HashMap 是基于哈希表的 Map 接口的非同步实现====>这里可以说明,它不能保证映射的顺序,特别是它不能保证该顺序亘古不变,因为加入的元素是根据哈希值来存储的。HashMap允许存储null的key值和null的value值。

由于HashMap是基于哈希表来实现的,所以此实现假定哈希函数将元素适当地分布在各桶之间,可为基本操作(get 和 put)提供稳定的性能。迭代 collection 视图所需的时间与 HashMap 实例的“容量”(桶的数量)及其大小(键-值映射关系数)成比例。所以,如果迭代性能很重要,则不要将初始容量设置得太高或将加载因子设置得太低。

需要注意的是:HashMap 不是同步的,如果多个线程同时访问一个 HashMap,而其中至少一个线程从结构上(指添加或者删除一个或多个映射关系的任何操作)修改了,则必须保持外部同步,以防止对映射进行意外的非同步访问。

2.实现原理

HashMap中的存储方式是数组+链表+红黑树。其中数组的类型是Entry类型的数组,当我们往HashMap内填充元素时,首先会计算其key的hashcode来重新计算key的hash值,并找到数组中对应的下标,如果该位置目前并没有元素,则直接将该元素放入数组中;如果该位置目前已经有了元素,则把新的元素加入到链表中。当元素的长度超过阈值(JDK1.8中该值为8)时,链表则会转换为红黑树(转换为红黑树还需要满足其他的条件,链表长度达到阈值只是其中的一个条件),这样会大大提高我们查找的效率。

HashMap的存储结构图。当链表过长时(>=8),会转换成红黑树来存储,以便提高查找效率:

使用这种存储方式是为了解决哈希碰撞的问题,换言之,链表中的每个key,都具有相同的哈希值。最极端的情况就是,当所有的元素都具有相同的哈希值,那么HashMap会退化为一个链表,查找时间也从O(1)上升到O(N)。当N越来越大时,get(key)方法的开销也越来越大。因此,在JDK1.8里面加入了一个红黑树:当某个桶内的记录过大的话(>=8),HashMap会动态的使用一个专门的treemap实现来替换掉它。这样做的结果会更好,是O(logn),而不是糟糕的O(n)。它是如何去工作的呢:

前面产生冲突的那些key对应的记录只是简单的追加到一个链表后面,这些记录只能通过遍历来进行查找。但是超过这个阈值后HashMap开始将列表升级成一个二叉树,使用哈希值作为树的分支变量,如果两个哈希值不等,但指向同一个桶的话,较大的那个会插入到右子树里。如果哈希值相等,HashMap希望key值最好是实现了Comparable接口的,这样它可以按照顺序来进行插入。

3.源码及分析

首先看一下HashMap的定义以及一些属性

public class HashMap<K,V> extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable {

    private static final long serialVersionUID = 362498820763181265L;
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
    static final int MAXIMUM_CAPACITY = 1 << 30;
    static final float DEFAULT_LOAD_FACTOR = 0.75f;
    static final int TREEIFY_THRESHOLD = 8;
    transient Node<K,V>[] table;
    transient Set<Map.Entry<K,V>> entrySet;
    transient int size;
    transient int modCount;
    int threshold;
    final float loadFactor;

在这里我们可以看到,HashMap是继承于AbstractMap,并且实现了Map, Cloneable, Serializable接口。其默认的初始容量为16(DEFAULT_INITIAL_CAPACITY = 1 << 4),最大容量为2的30次幂(MAXIMUM_CAPACITY = 1 << 30),默认的加载因子为0.75(即当HashMap目前存储的元素超过其初始值加载因子,即160.75=12时,HashMap会进行扩容)。其他的我们可以看到TREEIFY_THRESHOLD = 8;表明当链表长度超过8时,会转化为红黑树。

HashMap中涉及的数据结构:

static class Node<K,V> implements Map.Entry<K,V> {
      //以下4行即为一个Entry 
       final int hash;
        final K key;
        V value;
        Node<K,V> next;

        Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }

HashMap的构造函数:

//构造函数1:指定初始容量和加载因子
    public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        /*指定的初始容量如果大于最大容量,则默认以最大容量座作为初始容 
         *量,则2的30次幂
          */   
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        //加载因子必须为正数
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值