HashMap及哈希表

最新推荐文章于 2024-05-06 08:30:13 发布

SuperDream1sd

最新推荐文章于 2024-05-06 08:30:13 发布

阅读量366

点赞数

本文链接：https://blog.csdn.net/SuperDream1sd/article/details/112154610

版权

HashSet

HashSet集合存储元素特点

无序不可重复

存储时顺序和取出顺序不同。
存储到HashSet的内容，存储到了HashMap中，特点和HashMap类似

HashMap

HashMap集合底层是哈希表/散列表的数据结构。非线程安全

采用散列技术将记录存储在一块连续的存储空间中，这块连续存储空间称为散列表或哈希表（Hash table）。

哈希表/散列表：一维数组，这个数组中每一个元素是一个单向链表。（数组和链表的结合体。）

同一个单向链表上所有节点的散列值相同。同意单向链表内节点内的hash值可以不相同，哈希算法最后通过取余得到数组下标的散列值，因此hash值有可能不相同。
HashMap集合的默认初始化容量是16，默认加载因子是0.75，扩容：扩容之后是原容量的2倍

默认加载因子是指当底层数组的容量达到75%的时候，数组开始扩容

重点：HashMap集合初始化容量必须是2的倍数，这也是官方推荐的，

因为达到散列均匀，为了提高HashMap集合的存取效率所必须的
哈希表是一个怎样的数据结构呢？
- 哈希表是一个数组和单向链表的结合体。
  
  数组：在查询方面效率很高，随机增删方面效率很低。
  
  单向链表：在随机增删方面效率较高，在查询方面效率很低。
  
  哈希表将以上的两种数据结构融合在一起，充分发挥他们各自的优点。
HashMap集合底层的源代码：

public class HashMap{
    //HashMap底层实际上就是一数组。（一维数组）
    Node<K,V>[] table;
    //静态的内部类HashMap.Node
    static class Node<K,V>{
        final int hash;//哈希值(哈希值是key的hashCode()方法的执行结果，hash值通过哈希函数/算法成为散列值，转换成存储成数组的下标)
        final K key;//存储到Map集合中的那个key
        V value;//存储到Map集合中的那个value
        Node<K,V> next;//下一节点的内存地址
    }
}
//哈希表/散列表：一维数组，这个数组中每一个元素是一个单向链表。（数组和链表的结合体。）

最主要掌握的是：
- map.put(k,v);实现原理：
  
  第一步：先将k,v封装到Node对象中
  
  第二步：底层会调用k的hashCode()方法得出hash值，然后通过哈希函数/哈希算法计算出散列值，即将hash值转换成数组的下标。
  
  下标位置上如果没有任何元素，就把Node添加到这个位置上。如果下标对应的位置上有Node即有链表，此时会拿着k和链表上每一个节点的k进行equals，如果所有的equals方法返回都是false，那么这个新节点将会被添加到链表的末尾。如果其中有重复的元素即equals方法返回true，那么这个节点的value将会被覆盖
- v=map.get(k);实现原理
  
  第一步：先调用k的hashCode()方法得出哈希值，通过哈希算法转换成数组下标，通过数组下标快速定位到某个位置上。
  
  第二步：如果这个位置上什么也没有，返回Null.如果这个位置上有单向链表，则会将k和单向链表上每一个节点中的k进行equals,如果所有equals方法返回false，那么get方法返回null,只要其中有一个节点的k和参数k equals的时候返回true，那么此时这个节点的value就是我要找的value,get最终返回这个要找的value
以上两个方法的实现原理，必须掌握。

重点：通过上述原理可以得出，HashMap集合的KEY,会先后调用两个方法，一个方法是hashCode(),一个方法是equals(),那么这两个方法都需要重写

向Map集合存取数据，都是先调用key的hashCode方法，然后再调用equals方法！

equals方法有可能调用，也有可能不调用。

拿put(k,v)距离，什么时候equals不会调用？

k.hashCode()返回哈希值

哈希值经过哈希算法转换成数组下标

数组下标位置上如果是null，equals不需要执行。

拿get(k)举例，什么时候equals不会调用？

如果单向链表上只有1个元素时，不需要调用equals方法。
为什么哈希表的随机增删，以及查询效率都很高？

增删都是在链表上完成，查询也不需要都扫描，因此处于数组和链表的中间。
HashMap集合key部分特点：

无序，不可重复。

为什么无序？因为不一定挂到哪个单向链表上，即不知道放到数组的哪个位置上，是根据hash通过哈希算法计算出的散列值决定。

**为什么不可重复？**equals方法来保证HashMap集合的key不可重复。如果key重复了，value会被覆盖。

HashMap集合允许key和value为null,但是HashMap集合key的null只能有一个。

HashTable不允许key为null,也不允许value为null。

放在HashMap集合key部分的元素其实就是放到HashSet集合中了。

所以HashSet集合中的元素也需要同时重写hashCode()+equals()方法。
为什么hashCode()和equals()方法需要重写？

如果不重写hashCode()方法，由于每个对象默认的hashCode()的方法生成的hash值全都不同，因此会导致每个key会放到不同的数组位置，使得哈希表变成了单一的数组，即便对象内容相同也无法比较，会导致重复。

equals方法不重写，则会导致比较的是内存地址，无法比较对象内容判断是否重复。

注意：如果一个类的equals方法重写了，那么hashCode()方法必须重写。

并且equals方法返回如果是true，hashCode()方法返回的值必须一样。

equals方法返回true表示两个对象相同，在同一个单向链表上比较。

那么对于同一个单向链表上的节点来说，他们的散列值都是相同的。所以

hashCode()方法的返回值也应该相同。

hashCode()方法和equals()方法使用IDEA生成，根据业务需求，选择对应的属性值。

结论：放在HashMap集合KEY部分的，以及放在HashSet集合的元素，需要同时重写hashCode方法和equals方法

对于哈希表数据结构来说：

如果o1和o2的hash值相同，一定是放到同一个单向链表上。

当然如果o1和o2的hash值不同，但由于哈希算法执行结束之后转换的数组下标可能相同，此时会发生“哈希碰撞”。
哈希表HashMap使用不当时无法发挥性能！

倘若使hashCode()方法返回一个固定的值，则会导致哈希表变成一个单向链表。这种情况称为：散列分布不均匀。每个单向链表上的节点数相同，是最好的，叫散列分布均匀

倘若hashCode()方法返回的值都不一样，会导致哈希表称为一维数组，没有了链表的概念，也就是散列分布不均匀。

散列分布均匀需要你重写hashCode()有一定的技巧
jdk8之后，如果哈希表单向链表中元素超过8个，单向链表这种数据结构会变成红黑树数据结构，当红黑树上的节点数量小于6时，会重新把红黑树变成单向链表数据结构，这种方式也是为了提高检索效率，二叉树的检索会再次缩小扫描范围，提高效率。初始化容量16，默认加载因子0.75，扩容是：扩容之后是原容量的2倍

HashTable

HashTable不允许key和value为null

Hashtable方法都带有sychronized：线程安全的。线程安全有其它的方案，这个Hashtable对线程的处理导致效率较低，使用较少了.

Hashtable的初始容量是11，默认因子是0.75

Hashtable的扩容是：原容量的2倍加1.

Properties

目前只需掌握Properties对象的相关方法

Properties是一个Map集合，继承HashTable，Properties的key和value都是String类型。Properties被称为属性类对象。容量和HashTable相同

Properties pro =new Properties();
//掌握Properties的两个方法，一个取，一个存
//存
pro.setProperty("ss","123s");
//取
String s=pro.getProperty("ss");

SuperDream1sd

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

HashMap及哈希表

HashSet

HashMap

HashMap集合底层是哈希表/散列表的数据结构。非线程安全

HashMap集合的默认初始化容量是16，默认加载因子是0.75，扩容：扩容之后是原容量的2倍

哈希表是一个怎样的数据结构呢？

HashMap集合底层的源代码：

最主要掌握的是：

为什么哈希表的随机增删，以及查询效率都很高？

HashMap集合key部分特点：

HashMap集合允许key和value为null,但是HashMap集合key的null只能有一个。

HashTable不允许key为null,也不允许value为null。

为什么hashCode()和equals()方法需要重写？

注意：如果一个类的equals方法重写了，那么hashCode()方法必须重写。

对于哈希表数据结构来说：

哈希表HashMap使用不当时无法发挥性能！

HashTable

Properties