HashSet
HashSet集合存储元素特点
无序不可重复
- 存储时顺序和取出顺序不同。
- 存储到HashSet的内容,存储到了HashMap中,特点和HashMap类似
HashMap
-
HashMap集合底层是哈希表/散列表的数据结构。非线程安全
采用散列技术将记录存储在一块连续的存储空间中,这块连续存储空间称为散列表或哈希表(Hash table)。
哈希表/散列表:一维数组,这个数组中每一个元素是一个单向链表。(数组和链表的结合体。)
同一个单向链表上所有节点的散列值相同。同意单向链表内节点内的hash值可以不相同,哈希算法最后通过取余得到数组下标的散列值,因此hash值有可能不相同。
-
HashMap集合的默认初始化容量是16,默认加载因子是0.75,扩容:扩容之后是原容量的2倍
默认加载因子是指当底层数组的容量达到75%的时候,数组开始扩容
重点:HashMap集合初始化容量必须是2的倍数,这也是官方推荐的,
因为达到散列均匀,为了提高HashMap集合的存取效率所必须的
-
哈希表是一个怎样的数据结构呢?
-
哈希表是一个数组和单向链表的结合体。
数组:在查询方面效率很高,随机增删方面效率很低。
单向链表:在随机增删方面效率较高,在查询方面效率很低。
哈希表将以上的两种数据结构融合在一起,充分发挥他们各自的优点。
-
-
HashMap集合底层的源代码:
public class HashMap{
//HashMap底层实际上就是一数组。(一维数组)
Node<K,V>[] table;
//静态的内部类HashMap.Node
static class Node<K,V>{
final int hash;//哈希值(哈希值是key的hashCode()方法的执行结果,hash值通过哈希函数/算法成为散列值,转换成存储成数组的下标)
final K key;//存储到Map集合中的那个key
V value;//存储到Map集合中的那个value
Node<K,V> next;//下一节点的内存地址
}
}
//哈希表/散列表:一维数组,这个数组中每一个元素是一个单向链表。(数组和链表的结合体。)
-
最主要掌握的是:
-
map.put(k,v);实现原理:
第一步:先将k,v封装到Node对象中
第二步:底层会调用k的hashCode()方法得出hash值,然后通过哈希函数/哈希算法计算出散列值,即将hash值转换成数组的下标。
下标位置上如果没有任何元素,就把Node添加到这个位置上。如果下标对应的位置上有Node即有链表,此时会拿着k和链表上每一个节点的k进行equals,如果所有的equals方法返回都是false,那么这个新节点将会被添加到链表的末尾。如果其中有重复的元素即equals方法返回true,那么这个节点的value将会被覆盖
-
v=map.get(k);实现原理
第一步:先调用k的hashCode()方法得出哈希值,通过哈希算法转换成数组下标,通过数组下标快速定位到某个位置上。
第二步:如果这个位置上什么也没有,返回Null.如果这个位置上有单向链表,则会将k和单向链表上每一个节点中的k进行equals,如果所有equals方法返回false,那么get方法返回null,只要其中有一个节点的k和参数k equals的时候返回true,那么此时这个节点的value就是我要找的value,get最终返回这个要找的value
以上两个方法的实现原理,必须掌握。
重点:通过上述原理可以得出,HashMap集合的KEY,会先后调用两个方法,一个方法是hashCode(),一个方法是equals(),那么这两个方法都需要重写
向Map集合存取数据,都是先调用key的hashCode方法,然后再调用equals方法!
equals方法有可能调用,也有可能不调用。
拿put(k,v)距离,什么时候equals不会调用?
k.hashCode()返回哈希值
哈希值经过哈希算法转换成数组下标
数组下标位置上如果是null,equals不需要执行。
拿get(k)举例,什么时候equals不会调用?
如果单向链表上只有1个元素时,不需要调用equals方法。
-
-
为什么哈希表的随机增删,以及查询效率都很高?
增删都是在链表上完成,查询也不需要都扫描,因此处于数组和链表的中间。
-
HashMap集合key部分特点:
无序,不可重复。
为什么无序?因为不一定挂到哪个单向链表上,即不知道放到数组的哪个位置上,是根据hash通过哈希算法计算出的散列值决定。
**为什么不可重复?**equals方法来保证HashMap集合的key不可重复。如果key重复了,value会被覆盖。
HashMap集合允许key和value为null,但是HashMap集合key的null只能有一个。
HashTable不允许key为null,也不允许value为null。
放在HashMap集合key部分的元素其实就是放到HashSet集合中了。
所以HashSet集合中的元素也需要同时重写hashCode()+equals()方法。
-
为什么hashCode()和equals()方法需要重写?
如果不重写hashCode()方法,由于每个对象默认的hashCode()的方法生成的hash值全都不同,因此会导致每个key会放到不同的数组位置,使得哈希表变成了单一的数组,即便对象内容相同也无法比较,会导致重复。
equals方法不重写,则会导致比较的是内存地址,无法比较对象内容判断是否重复。
注意:如果一个类的equals方法重写了,那么hashCode()方法必须重写。
并且equals方法返回如果是true,hashCode()方法返回的值必须一样。
equals方法返回true表示两个对象相同,在同一个单向链表上比较。
那么对于同一个单向链表上的节点来说,他们的散列值都是相同的。所以
hashCode()方法的返回值也应该相同。
hashCode()方法和equals()方法使用IDEA生成,根据业务需求,选择对应的属性值。
结论:放在HashMap集合KEY部分的,以及放在HashSet集合的元素,需要同时重写hashCode方法和equals方法
对于哈希表数据结构来说:
如果o1和o2的hash值相同,一定是放到同一个单向链表上。
当然如果o1和o2的hash值不同,但由于哈希算法执行结束之后转换的数组下标 可能相同,此时会发生“哈希碰撞”。
-
哈希表HashMap使用不当时无法发挥性能!
倘若使hashCode()方法返回一个固定的值,则会导致哈希表变成一个单向链表。这种情况称为:散列分布不均匀。每个单向链表上的节点数相同,是最好的,叫散列分布均匀
倘若hashCode()方法返回的值都不一样,会导致哈希表称为一维数组,没有了链表的概念,也就是散列分布不均匀。
散列分布均匀需要你重写hashCode()有一定的技巧
-
jdk8之后,如果哈希表单向链表中元素超过8个,单向链表这种数据结构会变成红黑树数据结构,当红黑树上的节点数量小于6时,会重新把红黑树变成单向链表数据结构,这种方式也是为了提高检索效率,二叉树的检索会再次缩小扫描范围,提高效率。初始化容量16,默认加载因子0.75,扩容是:扩容之后是原容量的2倍
HashTable
HashTable不允许key和value为null
Hashtable方法都带有sychronized:线程安全的。线程安全有其它的方案,这个Hashtable对线程的处理导致效率较低,使用较少了.
Hashtable的初始容量是11,默认因子是0.75
Hashtable的扩容是:原容量的2倍加1.
Properties
目前只需掌握Properties对象的相关方法
Properties是一个Map集合,继承HashTable,Properties的key和value都是String类型。Properties被称为属性类对象。容量和HashTable相同
Properties pro =new Properties();
//掌握Properties的两个方法,一个取,一个存
//存
pro.setProperty("ss","123s");
//取
String s=pro.getProperty("ss");