HashMap的存储结构及原理

最新推荐文章于 2023-05-21 00:12:52 发布

Double=Eggs

最新推荐文章于 2023-05-21 00:12:52 发布

阅读量2.9k

点赞数 1

分类专栏：【Java基础】

本文链接：https://blog.csdn.net/liweizhong193516/article/details/77416073

版权

【Java基础】专栏收录该内容

19 篇文章 0 订阅

订阅专栏

1、HashMap的数据结构(HashMap通过hashcode对其内容进行快速查找，是无序的)，数据结构中有数组和链表来实现对数据的存储，但这两者基本上是两个极端。

数组：数组的存储区是连续的，占用内存严重，故空间复杂度很大。但数组的二分查找时间度小；数组的特点：寻址容易，插入和删除困难。

链表：链表的储存区离散，占用内存比较宽松，故空间复杂度很小，但时间复杂度大；链表的特点：寻址困难，插入和删除容易。

哈希表
HashMap是由数组+链表组成；寻址容易，插入和删除容易。（存储单元数组Entry[]，数组里面包含链表）
HashMap其实也是由一个线性的数组实现的。所以可以理解为其存储数据的容器就是一个线性容器；
HashMap里面有一个内部静态类Entry，其重要的属性有key，value，next，从属性key，value 就可以很明显的看出来 Entry就是 HashMap键值对实现的一个基础bean；也就是说HashMap的基础就是一个线性数组，这个数组就是Entry[]，Map里面的内容都保存在Entry[]中；
/** 
 * The table, resized as necessary. Length MUST Always be a power of two. 
 */  
  
transient Entry[] table;  
2、HashMap的存取实现

2.1：存储
这里HashMap用了一个算法。
//存储时候：
int hash=key.hashCode(); //获取key的hashCode，这个值是一个固定的int值
int index=hash%Entry[].length；//获取数组下标：key的hash值对Entry数组长度进行取余
Entry[index]=value；
注意：如果两个key通过hash%Entry[].length得到的index相同，会不会覆盖？
是不会的。Entry类有一个next属性，作用是指向下一个Entry。打个比方，第一个键值对A进来，通过计算其key的hash得到的 index=0，记做:Entry[0] = A。一会后又进来一个键值对B，通过计算其index也等于0，现在怎么办？HashMap会这样做:B.next = A,Entry[0] = B,如果又进来C,index也等于0,那么C.next = B,Entry[0] = C；这样我们发现index=0的地方其实存取了A,B,C三个键值对,他们通过next这个属性链接在一起。所以疑问不用担心。
也就是说Entry[]数组中存储的是最后插入的数据
public V put(K key, V value) {  
        if (key == null)  
            return putForNullKey(value); //null总是放在数组的第一个链表中  
        int hash = hash(key.hashCode());  
        int i = indexFor(hash, table.length);  
        //遍历链表  
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {  
            Object k;  
            //如果key在链表中已存在，则替换为新value  
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {  
                V oldValue = e.value;  
                e.value = value;  
                e.recordAccess(this);  
                return oldValue;  
            }  
        }  
        modCount++;  
        addEntry(hash, key, value, i);  
        return null;  
    }  
  
   
void addEntry(int hash, K key, V value, int bucketIndex) {  
    Entry<K,V> e = table[bucketIndex];  
    table[bucketIndex] = new Entry<K,V>(hash, key, value, e); //参数e, 是Entry.next  
    //如果size超过threshold，则扩充table大小。再散列  
    if (size++ >= threshold)  
            resize(2 * table.length);  
}  
2.2：取值
获取key的hashcode指，通过hash值去hash%Entry[].length 获取Entry[hash%Entry[].length]，定位到该数组元素之后，再遍历该元素处的链表。
//取值时候：
int hash=key.hashCode();
int index =hash%Entry[].length;
return Entry[index];

[java] view plain copy
public V get(Object key) {  
    if (key == null)  
        return getForNullKey();  
    int hash = hash(key.hashCode());  
    //先定位到数组元素，再遍历该元素处的链表  
    for (Entry<K,V> e = table[indexFor(hash, table.length)];  
         e != null;  
         e = e.next) {  
        Object k;  
        if (e.hash == hash && ((k = e.key) == key || key.equals(k)))  
            return e.value;  
    }  
    return null;  
当哈希表的容量超过默认容量时，必须要调整table的大小。当容量达到最大值时，该方法Integer.MAX_VALUE返回，这时，就需要创建一张表，将原来的表映射到新表中。

3、HashMap、HashTable和ConcurrentHashMap的线程安全问题

HashMap：线程不安全的。

HashTable：锁住整张hash表，让线程独占。hashMap允许为空。通过分析Hashtable就知道，synchronized是针对整张Hash表的，即每次锁住整张表。让线程独占，安全的背后是巨大的浪费。

ConcurrentHashMap:一个更快的hashmap，它提供了好得多的并发性。多个读操作几乎总可以并发地执行。他是锁段（默认：把hash表分为16个段），在get，put，remove等操作中，ConcurrentHashMap只锁定当前需要用到的段，只有在求size的时候才锁定整张hash表。

Double=Eggs

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
13
评论
HashMap的存储结构及原理

1、HashMap的数据结构(HashMap通过hashcode对其内容进行快速查找，是无序的) 数据结构中有数组和链表来实现对数据的存储，但这两者基本上是两个极端。数组：数组的存储区是连续的，占用内存严重，故空间复杂度很大。但数组的二分查找时间度小；数组的特点：寻址容易，插入和删除困难。链表：链表的储存区离散，占用内存比较宽松，故空间复杂度很小，
复制链接

扫一扫