Set接口概述
- Set接口是Collection的子接口,set接口没有提供额外的方法
- Set集合不允许包含相同的元素
- Set判断两个对象是否相同不是使用==运算符,而是根据equals()方法
set实现类之一: HashSet
HashSet底层原理是一个哈希表(数组+链表/红黑树)
数组扩容机制: Set数组初始容量为16,当使用率超过0.75时,(16*0.75=12)就会扩大容量为原来的2倍
链表与红黑树转换:在Java8中如果一条链表的元素个数到达 TREEIFY THRESHOLD (默认是8) 并且 table的大小>=MIN_TREEIFY_CAPAITY (默认64),就会进行树化红黑树,否则仍然采用数组扩容机制
HasSet特点:
- 不能保证元素的排列顺序
- HashSet不是线程安全的
- 集合元素可以是null
判断元素相等标准: 两个对象通过hashCode()方法比较相等,并且两个对象的equals()方法返回值也相等
Set容器存放对象标准: 对应的类一定要重写equals()和hashCode(Object obj)方法,以实现对象相等规则
HashSet添加元素过程:
- 当向HashSet集合中存入一个元素时,HashSet会调用该对象的hashCode()方法来得到该对象的hashCode值,然后根据hashCode值,通过某种散列函数决定该对象在HashSet底层数组中的存储位置
- 如果两个元素的hashCode()值相等,会继续调用equals方法,如果equals方法结果为true,添加失败;如果为false,那么会保存该元素,但是该数组的位置上已经有元素了,那么会通过链表的方式继续链接
- 如果两个元素的equals()方法返回true,但是它们的hashCode()返回值不相等,hashSet将会把它们存储在不同的位置,但是依然可以添加成功
重写hashCode()方法的基本原则:
- 在程序运行时,同一个对象多次调用hashCode()方法应该返回相同的值
- 当两个对象的equals()方法比较返回true时,这两个对象的hashCode()方法的返回值也应相等
- 对象中用做equals()方法比较的Field,都应该用来计算hashCode值
Set实现类之二:LinkedHashSet
底层是一个哈希表(数组+链表/红黑树)+链表:多了一条链表(记录元素的存储顺序),保证元素有序。
- LinkedHashSet是HashSet的子类
- LinkedHashSet根据元素的hashCode值来决定元素存储位置,但它同时使用双向链表维护元素的次序,这使得元素看起来是以插入顺序保存的
- LinkedHashSet插入性能略低于HashSet,但在迭代访问Set里的全部元素时有很好的性能
- LinkedHashSet不允许集合元素重复
Set实现类之三:TreeSet
- TreeSet是SortedSet接口的实现类,TreeSet可以确保集合元素处于排序状态
- TreeSet底层使用红黑树结构存储数据
- TreeSet两种排序方法:自然排序和定制排序(默认自然排序)
特点:
- 有序
- 查询速度比List快