HashMap的研究

最新推荐文章于 2024-10-13 19:04:04 发布

weixin_33872566

最新推荐文章于 2024-10-13 19:04:04 发布

阅读量53

点赞数

文章标签： python 数据结构与算法

原文链接：https://my.oschina.net/u/2474041/blog/637437

版权

2019独角兽企业重金招聘Python工程师标准>>>

1.HashMap的概述

HashMap是map接口的实现，是线程非同步的。语序key为null,并且顺序是会变的。

HashMap的数据结构

HashMap实际上是一个数组和链表的结合体,简称链表散列。

从图中可以看出，HashMap是一个数组结构，而每个数组中的元素又是一个链表

Entry<,> Map.Entry<,> {
    ;
    ;
    Entry<,> ;
    ;

每个Entry指向下一个元素的引用，然而为什么数组中的每个元素是一个链表呢？因为HashMap

如果数组该位置上已经存放有其他元素了，那么在这个位置上的元素将以链表的形式存放，新加入的放在链头，最先加入的放在链尾。如果数组该位置上没有元素，就直接将该元素放到此数组中的该位置上。

3.HashMap中的方法

put(key, value) {
    (key == )
        putForNullKey(value);
    hash = (key.hashCode());
    i = (hash, .);
    (Entry<,> e = [i]; e != ; e = e.) {
        Object k;
        (e.== hash && ((k = e.) == key || key.equals(k))) {
            oldValue = e.;
            e.= value;
            e.recordAccess();
            oldValue;
        }
    }

    ++;
    addEntry(hash, key, value, i);
    ;
}

这个方法主要是在添加一个元素，首先判断key是否为空，

当key为null时，调用putForNullKey方法，将value放置在数组第一个位置。

当key不为空时，通过key的hashcode计算hash值，搜索指定hash值在对应table中的索引，判断是否为null,为null则添加到索引处。

   addEntry(hash, key, value, bucketIndex) {
Entry<,> e = [bucketIndex];
       [bucketIndex] = Entry<,>(hash, key, value, e);
       (++ >= )
           resize(* .);
   }

addEntry(hash, key, value, i)方法根据计算出的hash值，将key-value对放在数组table的i索引处。

get(Object key) {
    (key == )
        getForNullKey();
    hash = (key.hashCode());
    (Entry<,> e = [(hash, .)];
         e != ;
         e = e.) {
        Object k;
        (e.== hash && ((k = e.) == key || key.equals(k)))
            e.;
    }
    ;
}

理解put方法后，get方法其实就好理解了。反之即可，这里不再重复。

4. HashMap的resize（rehash）：

当HashMap中的元素越来越多的时候，hash冲突的几率也就越来越高，因为数组的长度是固定的。所以为了提高查询的效率，就要对HashMap的数组进行扩容，数组扩容这个操作也会出现在ArrayList中，这是一个常用的操作，而在HashMap数组扩容之后，最消耗性能的点就出现了：原数组中的数据必须重新计算其在新数组中的位置，并放进去，这就是resize。

那么HashMap什么时候进行扩容呢？当HashMap中的元素个数超过数组大小*loadFactor时，就会进行数组扩容，loadFactor的默认值为0.75，这是一个折中的取值。也就是说，默认情况下，数组大小为16，那么当HashMap中元素个数超过16*0.75=12的时候，就把数组的大小扩展为 2*16=32，即扩大一倍，然后重新计算每个元素在数组中的位置，而这是一个非常消耗性能的操作，所以如果我们已经预知HashMap中元素的个数，那么预设元素的个数能够有效的提高HashMap的性能。

5. HashMap的性能参数：

HashMap 包含如下几个构造器：

HashMap()：构建一个初始容量为 16，负载因子为 0.75 的 HashMap。

HashMap(int initialCapacity)：构建一个初始容量为 initialCapacity，负载因子为 0.75 的 HashMap。

HashMap(int initialCapacity, float loadFactor)：以指定初始容量、指定的负载因子创建一个 HashMap。

HashMap的基础构造器HashMap(int initialCapacity, float loadFactor)带有两个参数，它们是初始容量initialCapacity和加载因子loadFactor。

initialCapacity：HashMap的最大容量，即为底层数组的长度。

loadFactor：负载因子loadFactor定义为：散列表的实际元素数目(n)/ 散列表的容量(m)。

负载因子衡量的是一个散列表的空间的使用程度，负载因子越大表示散列表的装填程度越高，反之愈小。对于使用链表法的散列表来说，查找一个元素的平均时间是O(1+a)，因此如果负载因子越大，对空间的利用更充分，然而后果是查找效率的降低；如果负载因子太小，那么散列表的数据将过于稀疏，对空间造成严重浪费。

HashMap的实现中，通过threshold字段来判断HashMap的最大容量：

转载于:https://my.oschina.net/u/2474041/blog/637437