set
set接口实现类:
1.HashSet:Set接口主要实现类,线程不安全,可以存储null值
public HashSet() {
map = new HashMap<>();
}
public boolean add(E e) {
//private static final Object PRESENT = new Object();
return map.put(e, PRESENT)==null;
}
用HashMap的key不可重复的原理达成set元素不可重复的原理,value存入一个一样的Object常量
- LinkedHashSet:HashSet子类,遍历内部数据时,可以按照添加数据的顺序遍历
2.TreeSet:可以按照添加对象指定属性(说明得是所有元素得是同一个类才能比对属性)进行排序
一、Set:存储无序的、不可重复的数据
以HashSet为例说明:
-
无序性:不等于随机性。HashSet的底层即hashMap是链表和数组的结合,存储的数据在底层数组(数组初始大小16)中并非按照数组索引的顺序先后添加,而是根据数据的哈希值决定的
先根据数据的哈希值通过算法得出它在数组放置的位置,当又一个数据被计算的出位置本来就有元素时,与那个位置(包括那个位置顺着往下的链表上的节点)的元素先判断哈希值是否一样,哈希值不一样肯定不是相等的对象,哈希值一样不一定是相等对象,要接着用equals方法判断是不是同一个元素,都不是同一个元素时插入链表,是同一个对象不插入,jdk7是头插法,直接插入数组的位置,jdk8是尾插法,插入数组元素往下的链表最后位置,俗称七上八下
-
不可重复性:添加的元素按照equals()判断时,返回true时添加失败,即:保证相同的元素只能添加一个。
二、添加元素的过程:以HashSet为例:
我们向HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值,
此哈希值接着通过某种算法计算出在HashSet底层数组中的存放位置(即为:索引位置),判断
数组此位置上是否已经有元素:
如果此位置上没有其他元素,则元素a添加成功。 --->情况1
如果此位置上有其他元素b(或以链表形式存在的多个元素),则比较元素a与元素b的hash值:
如果hash值不相同,则元素a添加成功。--->情况2
如果hash值相同,进而需要调用元素a所在类的equals()方法:
equals()返回true,元素a添加失败
equals()返回false,则元素a添加成功。--->情况2
对于添加成功的情况2和情况3而言:元素a 与已经存在指定索引位置上数据以链表的方式存储。
jdk 7 :元素a放到数组中,指向原来的元素。
jdk 8 :原来的元素在数组中,指向元素a
总结:七上八下
HashSet底层:数组+链表的结构。
-
Set接口中没有额外定义新的方法,使用的都是Collection中声明过的方法。
-
要求:向Set(主要指:HashSet、LinkedHashSet)中添加的数据,其所在的类一定要重写hashCode()和equals(),不然引用Object的hashcode(),会导致本来相等的对象(即关键特征一样的对象)被添加进了set
-
要求:重写的hashCode()和equal