HashMap结构,原理

一.HashMap容器概念

容器存储结构:Entry[] table

    static class Entry<K,V> implements Map.Entry<K,V> {
        final K key;
        V value;
        Entry<K,V> next;
        final int hash;

容器大小:容器默认可以存放16个K-V元素;也可以自己指定容器大小;容器的大小始终为2的n次方,

数组的索引:key的hashcode * table.length

容器扩容阀值:threshold = table.length * 0.75 

容器扩容大小:table.size * 2

二.HashMap.put

分析HashMap.put(K,V)方法:

1.计算Key的hash值

2.根据容器大小和key的hashcode值计算table的索引index(hash & (length-1);)

3.table[index]=value存放

    hash值不相同:保存在table[index]=value位置

    hash值相同:进行equals比较:相同进行替换;不相同,链表方式新增;

4.如果table.size > table.length * 0.75 进行rehash,扩容;

所以:对象重写了equals方法,必须同时重写hashcode,为什么呢?

1.首先必须清楚object中的equals是比较内存地址,如果内存地址相等,则认为是2个相同的对象。

2.如果一个新的对象重写equals,则要求hashcode的计算规则要和equals的判断对象是否相同的逻辑保持一致,比如equals比较对象中的name属性,name相同认为对象相同,则此时hashcode的计算方式也必须用到name属性来计算hash,如果不重写,往hashmap这样的容器中存放会将相同的对象存在在不同的table中,因为不重写带来hashcode值可能不相同

三.HashMap的扩容

请看下面2段代码
//测试类
public class HashMapTest {

    public static void main(String[] args) {
        Map<Value, String> map = new HashMap<Value, String>(2);//初始容量2
        Map<Value, String> map = new HashMap<Value, String>(3);//初始容量4
        Map<Value, String> map = new HashMap<Value, String>();//初始容量16
        map.put(new Value("3"), "3");
        System.out.println(map);
        map.put(new Value("7"), "7");
        System.out.println(map);
        map.put(new Value("5"), "5");
        System.out.println(map);
        map.put(new Value("9"), "9");
        System.out.println(map);
    }
}

//存放于HashMap中的K-V
public class Value {

    private String value;

    public Value(String value) {
        this.value = value;
    }

    public String getValue() {
        return value;
    }

    public void setValue(String value) {
        this.value = value;
    }

    @Override
    public int hashCode() {
        return 1;//注意这里重写了
    }

    @Override
    public String toString() {
        return value;//注册这里重写了
    }

}

往HashMap中顺序存放3,7,5,9,如果初始容量大小不同,最终的结果是不同的,请看每种容量下的运行结果

1.初始容量为2,最终运行结果
Map<Value, String> map = new HashMap<Value, String>(2);//初始容量2,threshold = 1

这里运行的结果为:7,3,5,9,在put(5,5)后进行了扩容,table长度为4,在put(9,9)又一次扩容,table的长度为8
2.初始容量为3,最终运行结果
Map<Value, String> map = new HashMap<Value, String>(3);//初始容量4,threshold = 3

这里运行的结果为:3,7,5,9,进行了扩容,扩容后table的长度为8
3.初始容量为16,最终运行结果
Map<Value, String> map = new HashMap<Value, String>();//初始容量16,threshold = 12

这里运行的结果为:9,5,7,3,进行进行扩容,table的长度为16

------------------------------------------为什么呢?------------------------------------------
下面看下HashMap中的put方法
    public V put(K key, V value) {
        if (key == null)
            return putForNullKey(value);
        //计算hash值,并通过hash和table.length -1进行索引的计算
        int hash = hash(key.hashCode());
        int i = indexFor(hash, table.length);
        //对key进行hash和equals比较,若存在,进行value替换
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }

        modCount++;
        //该key不存在,新增Entry
        addEntry(hash, key, value, i);
        return null;
    }
新增entry
    void addEntry(int hash, K key, V value, int bucketIndex) {
	Entry<K,V> e = table[bucketIndex];
        table[bucketIndex] = new Entry<K,V>(hash, key, value, e);//把原先的e作为当前e的next值
        //查看当前的size是否超过了设定的阈值threshold,如果超过,需要扩容,注意这里进行了size++
        if (size++ >= threshold)
            resize(2 * table.length);
    }

将老的table迁移到新的table上
    void resize(int newCapacity) {
        Entry[] oldTable = table;
        int oldCapacity = oldTable.length;
        if (oldCapacity == MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return;
        }
        //创建新的Entry[]
        Entry[] newTable = new Entry[newCapacity];
        //rehash,将oldTable迁移到newTable
        transfer(newTable);
        table = newTable;
        //计算新的扩容阀值
        threshold = (int)(newCapacity * loadFactor);
    }
//rehash过程,将原先链表尾部的元素移动到newTable链表头部
    void transfer(Entry[] newTable) {
        Entry[] src = table;
        int newCapacity = newTable.length;
        //以new HashMap(2)来说,依次put(3,3),put(7,7)后,oldTable中的结构为7,next指向3
        for (int j = 0; j < src.length; j++) {
            //e对应的Entry对象key=7,value=7,next=3(Entry的key=3,value=3,next=null)
            Entry<K,V> e = src[j];
            if (e != null) {
                src[j] = null;
                do {
                    //next=3(Entry的key=3,value=3,next=null)
                    Entry<K,V> next = e.next;
                    int i = indexFor(e.hash, newCapacity);
                    e.next = newTable[i];//第1次遍历(e=7),next执行null,因为newTable[i]=null),第2次遍历(e=3),next指向newTable[i]已经存在的entry,也就是7
                    newTable[i] = e;//设置newTable[i] = 7
                    e = next;//下次遍历从当前e指向的next=3开始,所以这里可以看出,原先链表尾部的变成了链表头部
                } while (e != null);
            }
        }
    }
------------------------------------------------------------------------------
从源代码分析来看:
HashMap map = new HashMap(2),依次put(3,3),put(7,7),put(5,5),put(9,9)
经历第1次扩容后顺序变为3,7
经历第2次扩容后顺序变为7,3,5,9
------------------------------------------------------------------------------
四.HashMap死循环
产生的原因是:d多线程并发put时,形成了环形链表,引起死循环,分析如下
新建Map:HashMap map = new HashMap(8); 此时扩容的阀值threshod=6
线程1执行如下代码
map.put(new Value("1"), "1");
map.put(new Value("2"), "2");
map.put(new Value("3"), "3");
map.put(new Value("4"), "4");
map.put(new Value("5"), "5");
map.put(new Value("6"), "6");
map.put(new Value("7"), "7");

线程2执行如下代码
map.put(new Value("8"), "8");
在看rehash的代码
    void transfer(Entry[] newTable) {
        Entry[] src = table;
        int newCapacity = newTable.length;
        for (int j = 0; j < src.length; j++) {
            Entry<K,V> e = src[j];
            if (e != null) {
                src[j] = null;
                do {
                    Entry<K,V> next = e.next;//线程1挂起,开始切换线程2执行和扩容
                    int i = indexFor(e.hash, newCapacity);
                    e.next = newTable[i];
                    newTable[i] = e;
                } while (e != null);
            }
        }
    }
线程1在put(new Value("7"),"7")时进行扩容(因为size>thresold),扩容过程中在上面代码09行挂起,此时线程1的oldTable和newTable如下

线程2执行put(new Value("8","8")后,完成扩容,table.length=16,thresold=12,newTable如下

线程1唤醒继续扩容,此时线程2的newTable变成了table, 线程1扩容时将线程2的newTable移动倒线程1的newTable中

五.HashMap使用场景

适合于读多写少的场景,比如国家,地区列表的初始值可以放入全局的HashMap中,提高读取的速度

方法内部作临时转换用,比如按key进行分类,方便快速查找

六.思考点

为什么内部要用链表来实现呢?在来看下链表是啥回事




  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值