前言
本文仅作为作者的学习记录和回顾,不建议作为学习参考。推荐学习这篇文章:https://blog.csdn.net/w410589502/article/details/79636535
HashMap中涉及的知识点
0、HashMap的使用及特性
hashMap可以接受key或者value为null;
hashMap是非Synchronized的;
hashMap存储的是键值对。
1、hashing的概念
散列法(Hashing)或哈希法是一种将字符组成的字符串转换为固定长度(一般是更短长度)的数值或索引值的方法,称为散列法,也叫哈希法。
由于通过更短的哈希值比用原始值进行数据库搜索更快,这种方法一般用来在数据库中建立索引并进行搜索,同时还用在各种解密算法中。
2、HashMap的工作原理
从存取方法和数据结构两方面讲起:
HashMap是基于hashing原理的,我们使用put(key, value)的方式存储对象到HashMap中,使用get(key)的方式从HashMap中取出value。
当我们使用put()方法存储对象时,会先对key调用hashCode()方法,返回的hashCode用于计算bucket位置来存储Entry对象。
HashMap是在bucket中存储的键值对对象,就是Map.Entry。
HashMap的数据结构是基于数组和链表的。以数组存储元素,如果有hashCode相同的元素,就在数组结构中创建链表结构,再把hashCode相同的元素放在链表的下一个节点。
3、HashMap中解决碰撞的方法
hash碰撞就是hashCode相同的两个元素,都要存放在同一个位置,导致了冲突。
解决方法就是给后来的元素寻找下一个可以存放的位置。有拉链法和开放寻址法。
hashMap中解决碰撞的方法就是拉链法。
当出现冲突时,就在数组结构中创建一个链表结构,当前位置存放的旧Entry就要再多存一个next指针,指向数组外的另一个位置,把新Entry安排在这里,旧Entry的next指针就会指向保存新Entry的内存地址。如果还有冲突就把又冲突的那个Entry放在新的位置,新Entry的指针指向它,这样就形成一个链表。
这里注意的是,每次存放在链表时,是存放在头部而非尾部,这样可以防止将链表中所有的元素都遍历一遍。
4、equals()和hashCode()的应用,以及它们在HashMap中的重要性
equals:是否同一个对象实例。注意,是“实例”。比如String s = new String(“test”); s.equals(s), 这就是同一个对象实例的比较;
等号(==):对比对象实例的内存地址(也即对象实例的ID),来判断是否是同一对象实例;又可以说是判断对象实例是否物理相等;
Hashcode:我觉得可以这样理解:并不是对象的内存地址,而是利用hash算法,对对象实例的一种描述符(或者说对象存储位置的hash算法映射)——对象实例的哈希码。
5、不可变对象的好处
1、必要性
如果key是一个可变对象,那么在存数据和取数据的时候,对key进行hashCode()计算过后会生成不同的hashcode,就会导致找不到原来的数据。
String, Interger这样的wrapper类作为HashMap的键是再适合不过了,而且String最为常用。因为String是不可变的,也是final的,而且已经重写了equals()和hashCode()方法了。
2、线程安全
如果你可以仅仅通过将某个field声明成final就能保证hashCode是不变的,那么请这么做吧。
因为获取对象的时候要用到equals()和hashCode()方法,那么key正确的重写这两个方法是非常重要的。如果两个不相等的对象返回不同的hashcode的话,那么碰撞的几率就会小些,这样就能提高HashMap的性能。
6、HashMap多线程的条件竞争
当两个线程同时要对hashMap进行扩容时,在调整大小的过程中,存储在链表中的元素的次序会反过来,因为移动到新的bucket位置的时候,HashMap并不会将元素放在链表的尾部,而是放在头部,这是为了避免尾部遍历(tail traversing)。如果条件竞争发生了,那么就死循环了。
7、重新调整HashMap的大小
hashMap默认的负载因子大小为0.75,也就是说,当一个map填满了75%的bucket时候,和其它集合类(如ArrayList等)一样,将会创建原来HashMap大小的两倍的bucket数组,来重新调整map的大小,并将原来的对象放入新的bucket数组中。这个过程叫作rehashing,因为它调用hash方法找到新的bucket位置。