请聊一下Java的集合类,以及在项目中是如何使用的
概述
常用的集合类 如上图所示,下面会对每个集合做大体的概述
其实整个Java集合大体分为两大类,实现Collection接口
,以及实现Map接口
。 其实每种实现方式都望文生义,接下来我们会详细的讲述下。
1. ArrayList
ArrayList
其实底层就是基于数组实现的。其实Java中数组是定长的,ArrayList
同样如此,只不过ArrayList
内部实现了自动扩容。
所以ArrayList的API 都是重写了接口List的API。
1.1 扩容机制
ArrayList的详细的扩容机制如下图所示:
1.2 不同版本区别:
1.2.1 JDK1.8
底层是基于数组实现,空构造器长度是0. 第一次调用add方法后,开始扩容 && 到达一定长度后,也会进行数组扩容
这么做的目的为了干啥呢??? 防止使用者在使用的过程中 实例化后不进行使用,被数组占用的内存白白浪费了
1.2.2 JDK1.7
基于数组实现,默认长度是10
2. LinkedList
LinkedList
直接就能看出来,是基于链表实现的。
所以很多API 都是基于链表的特征而出现的。例如:addFirst
, addLast
3. Vector
此API 也是基于数组实现的。但是常常用来跟ArrayList
做比较。详细的可以看上述思维导图。但是大体上分为两点:
- 扩容大小不同ArrayList默认扩容是1.5倍, 但是Vector默认扩容是2倍
- 是否线程安全ArrayList不是线程安全的,但是Vector是线程安全的
4. HashSet
特征:无序,唯一
HashSet 依托于HashMap来实现的。 必须重写两个方法
- 重写hashCode方法
- 重写equals 方法
5. TreeSet
TreeSet依托于TreeMap来实现的。
6. HashMap
6.1 实现原理
HashMap
底层是基于数组 + 链表
实现的。 源码中有几处比较关键的点:
6.2 源码中关键点
- 底层基于hash函数来获取对应的数组下标
- 数组的默认长度是16
- 负载因子 默认长度是0.75.
- 【threshold】 表示扩容阈值 = 负载因子 * 数组长度
6.3 不同版本的区别
6.3.1 JDK1.7
每次添加节点,都是头节点
6.3.2 JDK1.8
-
每次添加节点,都是尾节点
-
当链表的节点 添加到第八的时候(>=7),将链表转换为红黑树
// 一直循环添加节点
for (int binCount = 0; ; ++binCount) {
// 循环 到链表的下一个节点为null的情况
if ((e = p.next) == null) {
// 给链表的尾部 构建新的节点
p.next = newNode(hash, key, value, null);
// 如果节点个数 >= 7. 添加到第八个节点
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
// 此方法将链表转化为红黑树
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
- 当节点减少到第6(<=6)个的时候,将tree转换为链表
7. TreeMap
底层基于二叉搜索树来实现。
8. 应用场景
还是基于业务需求 以及了解每个集合的特征。大体上分为三种数据结构:
数组
,链表
,二叉树
。
如果开发中 读取多,插入少,可以用基于数组实现的集合
如果开发中 读取少,插入多,可以用基于链表实现的集合
如果值必须是唯一的,可以使用Set相关集合。
所以具体的集合使用,是基于业务而定。