文章目录
Set接口
父接口是Collection接口
Set用于存放无序的、不可重复的数据
它的具体实现类:
- HashSet
- 作为Set接口的主要实现类
- 线程不安全的
- 可以存储NULL值
- LinkedHashSet
- 是HashSet的子类
- 看似“有序”,遍历其内部数据,可以按照添加的顺序遍历
- TreeSet
- 底层存储结构是红黑树
- 要求添加的元素是同一个类创建的对象
- 可以按照这些对象的某些属性进行排序
- …
一些说明
- Set接口中没有额外定义新的方法,使用的都是Collection中声明过的方法
【Collection中声明过的方法】
- 添加
- add(Object obj)
- addAll(Collection coll)
- 获取有效元素的个数
- int size()
- 清空集合
- void clear()
- 是否使空集合
- boolean isEmpty()
- 是否包含某个元素
- boolean contains(Object obj):是通过元素的equals方法来判断是否是同一个对象
- boolean containsAll(Collection c):也是调用元素的equals方法来比较的,拿两个集合的元素挨个比较
- 删除
- boolean remove(Object obj):通过元素的equals方法判断是否是要删除的那个元素。只会删除找到的第一个元素
- boolean removeAll(Collection coll):取当前集合的差集
- 取两个集合的交集
- boolean retainAll(Collection c):把交集的结果存在当前集合中,不影响c
- 集合是否相等
- boolean equals(Object obj)
- 转成对象数组
- Object[] toArray()
- 数组转变成集合,使用的是Arrays.asList(),需要注意的是,如果传入new int[]{1,2,3}这样的数组,只会被当成一个元素,想要传入多个数字,直接Arrays.List(1,2,3)或者Arrays.List(new Integer[]{1,2,3})
- 获取集合对象的哈希值
- hashCode()
- 遍历
- iterator():返回迭代器对象,用于集合遍历
- 向Set(主要指HashSet、LinkedHashSet)中添加数据,其所在的类一定要重写hashCode()和equals(),重写的hashCode()和equals()尽可能保持一致性:相等的对象必须具有相等的散列码
- 重写两个方法的小技巧:对象中用作equals()方法比较的Field,都应该用来计算hashCode
理解“无序的”、“不可重复的”
【以HashSet为例说明】
无序性
- 不等于随机性
- 这里的无序不是指添加的顺序和遍历的顺序不一样
- 存储的数据在底层数组中并非按照数组索引的顺序添加,而是根据数据的哈希值决定的
不可重复性
保证添加的元素按照equals()判断时,不能返回true。即:相同的元素只能添加一个。
如果向Set中添加自定义的类,那么需要在类中重写equals和hashCode方法(自动生成),否则,即使是属性值一样,也会被当作两个不一样的对象,都会被添加到set中
HashSet添加元素的过程
通过理解向Set中添加数据的过程,能更好地理解“无序性”和“不可重复性”
底层用数组存储,默认长度是16,在JDK7中,是在创建HashSet的时候,数组就初始化为长度16的大小,在JDK8中,在创建HashSet对象时,底层数组并没有创建,而是在向HashSet中添加第一个元素时,初始化数组为16。
HashSet添加元素的过程:
- 向HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值
- 此哈希值接着通过某种算法计算出在HashSet底层数组中的存放位置(即索引位置)
- 判断数组此位置上是否已经有元素
- 如果此位置上没有其他元素,则元素a添加成功【情况1】
- 如果此位置上有其他元素(可能有多个元素,以链表的形式存在),则依次将元素a的哈希值与这些元素的哈希值作比较
- 如果哈希值不相同,则元素a添加成功【情况2】
- 如果哈希值相同,进而需要调用元素a所在类的equals()方法
- equals()返回true,元素a添加失败
- equals()返回false,则元素a添加成功【情况3】
对于添加成功的情况2和情况3而言:元素a与已经存在指定索引位置上数据以链表的方式存储
jdk7:元素a放到数组中,指向原来的数据
jdk8:原来的元素在数组中,指向元素a
HashSet底层:数组+链表
LinkedHashSet
LinkedHashSet作为HashSet的子类
在添加数据的同时,每个数据还维护了两个引用,记录此数据前一个数据和后一个数据
优点:对于频繁的遍历操作,LinkedHashSet效率高于HashSet
TreeSet
TreeSet可以按照添加对象的指定属性,进行排序
(所以,前提是,添加到TreeSet中的元素,得是同一个类的对象,得有相同的属性,才能进行排序)
一些说明
-
向TreeSet中添加数据,要求是相同类的对象
-
两种排序方式:
-
自然排序(实现Comparable接口)和定制排序(Comparator)
-
自然排序中,比较两个对象是否相同的标准为,compareTo()返回0,不再是equals()
-
定制排序中,比较两个对象是否相同的标准为:compare()返回0,不再是equals()
-
Comparable 和 Comparator
在Java中经常会涉及到对象数组的排序问题,那么就涉及对象之间的比较问题
Java实现对象排序的方式有两种:
- 自然排序:java.lang.Comparable
- 定制排序:java.util.Comparator
方式一:自然排序 java.lang.Comparable
- Comparable接口强行对实现它的每个类的对象进行整体排序。这种排序被称为类的自然排序
- 实现Comparable的类必须实现compareTo(Object obj)方法,两个对象即通过compareTo(Object obj)方法的返回来比较大小
- 如果当前对象this大于形参对象obj,则返回正整数
- 如果当前对象this小于形参对象obj,则返回负整数
- 如果当前对象this等于形参对象obj,则返回0
- 实现Comparable接口的对象列表(和数组)可以通过Collections.sort或Arrays.sort进行自动排序。实现此接口的对象可以用作有序映射中的键或有序集合中的元素,无需指定比较器
- 对于类C的每一个e1和e2来说,当且仅当e1.compareTo(e2)==0与e1.equals(e2)具有相同的boolean值时,类C的自然排序才叫做与equals一致。建议(虽然不是必须的)最好使自然排序与equals一致
方式二:定制排序 java.util.Comparator
- 当元素的类型没有实现java.lang.Comparable接口而又不方便修改代码,或者实现了java.lang.Comparable接口的排序规则,但是不适合当前的操作,那么可以考虑使用Comparator的对象来排序
- 重写compare(Object o1,Object o2)方法,比较o1和o2的大小
- 如果方法返回正整数,则表示o1大于o2
- 如果返回0,表示相等
- 返回负整数,表示o1小于o2
- 可以将Comparator传递给sort方法(如Collection.sort或Arrays.sort),从而允许在排序上实现精确的控制
- 还可以使用Comparator来控制某些数据结构(如有序set或者有序映射)的顺序,或者为那些没有自然顺序的对象collection提供排序【?】