1、Set接口
基本介绍:
-
无序(添加和取出的顺序不一致)不包括LinkedHashSet,没有索引,
-
不允许重复元素,所以最多包含一个null
-
JDK API中Set接口的实现类有:
常用方法:和Collection接口一样
使用举例:以HashSet为例
注意:取出的顺序虽然不是添加的顺序,但是取出顺序是固定的
Set set = new HashSet();
//1.set接口对象 不能存放重复的元素,可以添加一个null
//2.set接口存放数据是无序的(即添加的顺序和取出的顺序不一致)
//3.注意:取出的顺序虽然不是添加的顺序,但是取出顺序是固定的
set.add("john");
set.add("lucy");
set.add("john");//重复
set.add("jack");
set.add("hsp");
set.add("mary");
set.add(null);
set.add(null);
System.out.println("set="+set);//[null, hsp, mary, john, lucy, jack]
//遍历
//方式1:使用迭代器
System.out.println("===使用迭代器===");
Iterator iterator = set.iterator();
while (iterator.hasNext()) {
Object obj = iterator.next();
System.out.println("obj="+obj);
}
//方式2:使用增强for
System.out.println("===使用增强for===");
for (Object o : set) {
System.out.println("obj="+o);
}
//set接口对象,不能使用索引来获取
2、HashSet
2.1 HashSet基本介绍
-
HashSet实现了Set接口
-
HashSet实际上是HashMap实现的,源码:
-
可以存放null值,但只允许有一个null
-
HashSet不保证元素是有序的,取决于hash后,在确定索引的结果
-
不能有重复元素
2.2 添加元素细节
HashSet不能添加相同的元素/数据?
经典例题:
HashSet hashSet = new HashSet();
//HashSet不能添加相同的元素/数据?
hashSet.add("lucy");//可以添加
hashSet.add("lucy");//不能添加,因为是同一个字符串常量池对象
hashSet.add(new Dog("tom"));//ok
hashSet.add(new Dog("tom"));//no 重写了hashCode和equals方法
System.out.println("hashset="+hashSet);//hashset=[Dog{name='tom'}, Dog{name='tom'}, lucy]
//经典面试题 需看源码
hashSet.add(new String("jack"));//ok
hashSet.add(new String("jack"));//添加不了 String 重写了hashCode方法,相同内容的String对象返回一样的哈希值,也重写了equals
System.out.println("hashset="+hashSet);
2.3 HashSet底层机制
因为HashSet实际上是HashMap实现的
HashMap底层是(数组+链表+红黑树)
模拟一个HashMap的底层结构:
public class HashSetStructure {
public static void main(String[] args) {
//模拟一个HashMap的底层结构
//1.创建一个类型为Node的数组
Node_[] table = new Node_[16];
System.out.println("table="+table);
Node_ john = new Node_("john", null);
table[2] = john;
Node_ jack = new Node_("jack", null);
john.next = jack;//将jack连接到john的后面
Node_ rose = new Node_("Rose", null);
jack.next = rose;//将Rose连接到jack的后面
Node_ lucy = new Node_("Lucy", null);
table[3] = lucy;
System.out.println("table="+table);
}
}
class Node_ {
Object item;//存放数据
Node_ next;//指向下一个节点
public Node_(Object item, Node_ next) {
this.item = item;
this.next = next;
}
@Override
public String toString() {
return "Node_{" +
"item=" + item +
", next=" + next +
'}';
}
}
2.4 HashSet(HashMap)源码分析
添加元素的流程分析:
- HashSet底层是HashMap
- 添加一个元素时,先得到hash值 -->会转成索引值
- 找到存储数据表table,看这个索引位置是否已经存放元素
- 如果没有,直接添入
- 如果有,调用equals比较,如果相同,就放弃添加,如果不相同,则添加到最后
- 在Java8中,如果一条链表的元素个数到达TREEIFY_THRESHOLD(默认是8),并且table的大小 >= MIN_TREEIFY_CAPACITY(默认64),就会进行树化(红黑树)
源码解读:
HashSet hashSet = new HashSet();
hashSet.add("java");
hashSet.add("php");
hashSet.add("java");
System.out.println("set="+hashSet);
执行add(“java”)时:
- 进入无参构造
-
执行添加方法
PRESENT是一个对象类型的常量:
-
进入put方法:key 是要添加的元素,value是一个常量
-
进入hash方法:该方法得到key对应的hash值 算法 : (h = key.hashCode()) ^ (h >>> 16)
-
返回值后,进入putVal方法:
- 第一个if语句:当前table为null或者长度为0,就执行resize方法进行扩容
- 第二个if语句:根据 i=(n-1) & hash 来计算出当前元素应该存储的位置
- 如果p ==null,表示该位置未存放元素,newNode,存放到i位置
- 最后返回null到put–>add方法
执行add(“php”)时:流程相似
执行add(“java”)时:
-
进入add --> put --> putVal
-
进入putVal后
-
p的值会判断不为null(已经存放过“java”),进入else
-
进入第一个 if 判断:满足以下两个条件
-
p.hash == hash //表示要插入的当前元素e与要插入位置元素p的hash值是否相同
-
((k = p.key) == key || (key != null && key.equals(k)))) //若要插入的当前元素e与要插入位置元素p是否是同一个元素 //或者两个元素通过equals方法判断是否相同
-
-
若满足则 e=p 新元素替换老元素,并返回
-
不满足则进入else if,判断p是否是一个红黑树
- 若是红黑树,则进入putTreeVal方法
-
也不是红黑树,进入下一个else
-
循环比较该索引位置的链表
-
相同则直接break;若都不相同,则直接加入到该链表最后
-
加入之后,立即判断该链表是否已经到达8,若到达8,执行treeifyBin(tab, hash)方法:先判断
-
if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)(64) resize(); //会先判断当前数组是否小于64,小于则先扩容数组 //大于64则会将当前链表转为红黑树
-
-
-
加入之后结束
-
2.5 HashSet的扩容和树化
- HashSet底层是HashMap,第一次添加时,table数组扩容到16,临界值(threshold)是(16 * 加载因子(loadFactor)是0.75 )=12;
- 如果table数组的size(每添加一个元素size就会+1)使用到了临界值12**,就会按照2倍扩容到16 * 2=32,新的临界值等于32 * 0.75 = 24,依次类推;
- 在jdk8中,如果一条链表的元素个数到达TREEIFY_THRESHOLD(默认是8).并且table的大小>= MIN_TREEIFY CAPACITY(默认64),就会进行树化(红黑树),否则仍然采用数组扩容机制
3、LinkedHashSet
基本介绍:
- LInkedHashSet是HashSet的子类
- LinkedHashSet底层是一个LinkedHashMap,底层维护了一个数组+双向链表
- LinkedHashSet根据元素的hashCode值来决定元素的存储位置,同时使用链表维护元素的次序,这使得元素看起来是以插入顺序保存的。
- 不允许添加重复元素
-
在LinkedHastSet中维护了一个hash表和双向链表(LinkedHashSet有head和tail)
-
每一个节点有before和after属性,这样可以形成双向链表
-
在添加一个元素时,先求hash值,在求索引…确定该元素在table的位置,然后将添加的元素加入到双向链表(如果已经存在,不添加[原则和hashset一样])
tail.next = newElement H/示意代码
newElement.pre = tail
tail = newEelment;
-
这样的话,我们遍历LinkedHashSet 也能确保插入顺序和遍历顺序一致