Java集合框架-Collection子接口之二-Set接口
Set接口概述
- Set接口是Collection的子接口,set接口没有提供额外的方法
- Set集合不允许包含相同的元素,如果试把两个相同的元素加入同一个Set集合中,则添加操作失败
- Set判断两个对象是否相同不是使用==运算符,而是根据equals()方法
- 要求:向Set中添加的数据,其所在的类一定要重写hashCode()和equals()
- 要求:重写的hashCode()和equals()尽可能保持一致性
Set的无序性和不可重复性的理解
- 无序性(以HashSet为例说明):
- 无序性不等于随机性。
- 存储的数据在底层数组中并非按照数组索引的顺序添加,而是根据数据的哈希值决定的。
- 不可重复性
- 保证添加的元素按照equals()和hashCode()方法,不能返回true。即:相同的元素只能添加一个。
Set中add(E e)操作的执行过程
以HashSet为例(实际底层是用HashMap实现的,数组加链表)
- 我们向HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值,
- 此哈希值接着通过某种算法计算出在HashSet底层数组中的存放位置(即为:索引位置)
- 判断此在数组中的次索引位置是否已经有元素了
- 如果此位置上没有其他元素,则元素a添加成功,放入数组中。—>成功情况1
- 如果此位置上有其他元素b(或者以链表形式存在多个元素),则比较元素a与元素b的hash值:
- 如果元素a与元素b的hash值不相同,则元素a添加成功。—>成功情况2
- 如果元素a与元素b的hash值相同,则需要进一步根据判断元素a所在类的equals()方法,判断元素a和元素b是否相同
- 如果equals()返回true,表示元素a与元素b相同,则元素a添加失败
- 如果equals()返回false,表示元素a与元素b不相同,则元素a添加成功 -->成功情况3
- 对于添加成功的情况2和情况3而言:元素a与一家存在指定索引位置上数据以链表的方式存储。但是在jdk7和jdk8两个版本中,插入的方式有所不同
- 在jdk7中使用头插法:元素a直接放到数组中(也就是链表的第一个元素),指向原来的元素
- 在jdk8中使用尾插法:原来的元素在数组中,在链表的尾部添加上元素a
- 总结:七上八下
hashCode()的重写
- 在程序运行时,用一个对象多次调用hashCode()方法应该返回相同的值
- 当两个对象equals()方法比较返回true时,这两个对象的hashCode()方法的返回值也应相等
- 对象中用作equals()方法比较的Field,都应该用来计算hashCode值。
public static int hashCode(Object a[]) {
if (a == null)
return 0;
int result = 1;
for (Object element : a)
result = 31 * result + (element == null ? 0 : element.hashCode());
return result;
}
问题:为什么复写hashCode()方法,有31这个数字?
- 选择系数的时候要选择尽量大的系数,因为如果计算出来的hash地址越大,所谓的“冲突”就越少,查找起来效率也会越高。(减少冲突)
- 并且31只占用5bits,相乘造成数据溢出的概率较小。
- 31可以由i*31 == (i<<5)-1来表示,现在很多虚拟机里面都有做相关优化。(提高算法效率)
- 31是个素数,素数作用就是如果用一个数字来乘以这个素数,那么最终出来的结果只能被素数本省和被乘数还有1来整除!(这样可以减少冲突)
Set实现类之一:HashSet
- 作为Set接口的主要实现类;线程不安全的;可以存储null值
- HashSet是Set接口的典型实现(主要实现类,线程不安全的),大多数时候使用Set集合时都使用这个实现类。
- HashSet按Hash算法来存储集合中的元素,因此具有很好的存取、查找、删除、性能。
- HashSet具有以下特点:
- 不能保证元素的排雷顺序
- HashSet不是线程安全的
- 集合元素可以是null(但是只能有一个null)
- HashSet集合判断两个元素相等的标准:两个对象通过hashCode()方法比较相等,并且两个对象的equals()方法返回值也相等
- 对于存放在Set容器中的对象,对应的类一定要重写equals()和hashCode(Object obj)方法,以实现对象相等规则。即:“相等的对象必须具有相等的散列码”。
Set实现类之二:LinkedHashSet
- 作为HashSet的子类;遍历其内部数据时,可以按照添加的顺序遍历
- LinkedHashSet是HashSet的子类
- LinkedHashSet根据元素的hashCode值来决定元素的存储位置,但它同时使用双向链表维护元素的次序,这使得元素看起来是以插入顺序保存的。
- LinkedHashSet插入性能略低于HashSet,但在迭代访问Set里的全部元素时有很好的性能
- LinkedHashSet不允许集合元素重复
- 优点
- 对于频繁的遍历操作,LinkedHashSet效率高与HashSet
- 底层结构图:
Set实现类之三:TreeSet
-
可以按照添加对象的指定属性,进行排序,父类是SortedSet
-
TreeSet是SortedSet接口的实现类,TreeSet可以确保集合元素处于排序状态。
-
TreeSet底层使用红黑树结构存储数据
-
新增的方法如下:(了解)
- Comparator comparator()
- Object first()
- Object last()
- Object lower(Object e)
- Object higher(Object e)
- SortedSet subSet(fromElement,toElement)
- SortedSet headSet(toElement)
- SortedSet tailSet(fromElement)
-
TreeSet两种排序方法:自然排序和定制排序。默认情况下,TreeSet采用自然排序
-
向TreeSet中添加的数据,要求是相同类的对象
-
两种排序方式:自然排序和定制排序
- 自然排序中,比较两个对象是否相同的标准为:compareTo()返回0,不再是equals()方法
- 定制排序中,比较两个对象是否相同的标准为:Comparator的compare()方法返回0,不再是equals()
-
使用:
-
package com.jl.java.base.collection.set; import org.junit.Test; import java.util.Comparator; import java.util.Iterator; import java.util.Objects; import java.util.TreeSet; /** * @author jiangl * @version 1.0 * @date 2021/4/23 9:53 */ public class TreeSetTest { /** * 1.向TreeSet中添加的数据,要求是相同类的对象 * 报错java.lang.ClassCastException: java.lang.Integer cannot be cast to java.lang.String */ @Test public void test1(){ TreeSet treeSet = new TreeSet(); //不能添加不同类的对象 // treeSet.add(123123); // treeSet.add("fdafa"); //举例一 treeSet.add(123); treeSet.add(223); treeSet.add(23); treeSet.add(13); treeSet.add(12333); Iterator iterator = treeSet.iterator(); while(iterator.hasNext()){ System.out.println(iterator.next()); } } @Test public void test2(){ //定制排序 TreeSet<TreeUser> treeSet = new TreeSet<TreeUser>(new Comparator<TreeUser>() { @Override public int compare(TreeUser o1, TreeUser o2) { if(o1.getAge() > o2.getAge()){ return 1; }else if(o1.getAge() < o2.getAge()){ return -1; }else { return o1.getName().compareTo(o2.getName()); } } }); //不能添加不同类的对象 // treeSet.add(123123); // treeSet.add("fdafa"); //举例一 treeSet.add(new TreeUser("dfas",23)); treeSet.add(new TreeUser("d11fas",23)); treeSet.add(new TreeUser("1dfas",13)); treeSet.add(new TreeUser("d3fas",2123)); treeSet.add(new TreeUser("d3fas",3)); treeSet.add(new TreeUser("dgfas",923)); treeSet.add(new TreeUser("dffas",123)); Iterator iterator = treeSet.iterator(); while(iterator.hasNext()){ System.out.println(iterator.next()); } } @Test public void test3(){ //自然排序 TreeSet<TreeUser> treeSet = new TreeSet<TreeUser>(); //不能添加不同类的对象 // treeSet.add(123123); // treeSet.add("fdafa"); //举例一 treeSet.add(new TreeUser("dfas",23)); treeSet.add(new TreeUser("d11fas",23)); treeSet.add(new TreeUser("1dfas",13)); treeSet.add(new TreeUser("d3fas",2123)); treeSet.add(new TreeUser("d3fas",3)); treeSet.add(new TreeUser("dgfas",923)); treeSet.add(new TreeUser("dffas",123)); Iterator iterator = treeSet.iterator(); while(iterator.hasNext()){ System.out.println(iterator.next()); } } } class TreeUser implements Comparable<TreeUser>{ private String name; private int age; public TreeUser(String name, int age) { this.name = name; this.age = age; } /* @Override public boolean equals(Object o) { if (this == o) { return true; } if (o == null || getClass() != o.getClass()) { return false; } TreeUser treeUser = (TreeUser) o; return age == treeUser.age && Objects.equals(name, treeUser.name); } @Override public int hashCode() { return Objects.hash(name, age); }*/ public String getName() { return name; } public void setName(String name) { this.name = name; } public int getAge() { return age; } public void setAge(int age) { this.age = age; } @Override public String toString() { return "TreeUser{" + "name='" + name + '\'' + ", age=" + age + '}'; } @Override public int compareTo(TreeUser o) { int i = this.getName().compareTo(o.getName()); if(i != 0){ return i; }else{ return Integer.compare(this.getAge(),o.getAge()); } } }
-
-
TreeSet和TreeMap都采用红黑树的存储结构
- 特点:有序,查询速度比List块