Connection
List有下标 有序且可重复 存进顺序与取出顺序一致
ArrayList 一维数组
LinkedList 双向链表
Vector 一维数组 线程安全
Stack 栈 线程安全Set无下标 无序且不可重复 存入顺序与取出顺序不一致(无序!=随机)
HashSet 一维数组 根据Unicode码计算Hash值以此为顺序存入数组 底层由HashMap实现 LinkedHashSet 双向链表 底层由LinkedHashMap实现
TreeSet 二叉树 底层由TreeMap实现
Map
HashMap 无序 key是唯一的
JDK1.7:一维数组+单向链表,头插法
JDK1.8:一维数组+单向链表+红黑树,尾插法,计算hash值高16位^低16位
一维数组+单向链表 --> 一维数组 + 红黑树:数组长度大于64,并链表长度大于8
一维数组 + 红黑树 --> 一维数组+单向链表:红黑树节点小于6
为了提高查询效率加入红黑树LinkedHashMap 双向链表
HashTable 线程安全(方法加锁,效率低,已弃用)
ConcurrentHashMap 线程安全(局部加锁)
TreeMap 针对key排序、红黑树,泛型需要实现comparable接口,或者comparator
Properties 配置文件
迭代器
Itr -- implements Iterator
cursor(游标), lastRet(当前下标), expectedModeCount(内部操作数)
ListItr -- implements ListIterator modCount外部操作数
添加元素、删除元素会++(即数组长度变化),个数发生改变
ArrayList
extends AbstractList implements LIst
elementData(数组容器), size(元素个数/指针)
默认容量:10
最大容量:Integer.MAX_VALUE-8(减八是为了存放数组头部信息)
扩容机制:原长度的1.5倍 初始化无参构造:将空数组赋给数组容器,并调用有参构造,初始值10
有参构造:指定大小创建数组(若数组长度大,则使用有参构造指定长度创建,减少扩容次数与几率)判断指定大小是否大于零
大于则创建容量为指定大小的数组
等于则将空数组(不同于无参构造所赋的空数组)赋给数组容器
小于则抛出异常
LinkedList
ArrayList和LinkedList的效率问题
ArrayList的数据结构:一维数组
LinkedList的数据结构:双向链表
添加数据不扩容的情况 -- ArrayList效率高(ArrayList直接添加元素)
添加数据扩容的情况 -- LinkedList效率高(ArrayList需要复制数组)
删除数据 -- LinkedList效率高(LinkedList直接解链)
修改数据 -- ArrayList效率高 查询数据 -- ArrayList效率高(一维数组高于链表查询效率)在处理业务时,查询功能使用较多,ArrayList查询快,所以使用ArrayList的频率更高
存在队列模式与栈模式
Vector
JDK1.2出现的集合框架
Veckor(JDK1.0) 存在容量增量,默认容量:10Array List与Vector的区别
ArrayList是JDK1.2才有的类,线程不安全,扩容机制是原长度的1.5倍
Vector是JDK1.0就有的类,线程安全(方法加锁),扩容机制需要判断容量增量,若容量增量为0,扩容机制就是原长度的2倍,容量增量大于0,扩容机制就是原长度+容量增量
TreeSet\TreeMap
TreeSet底层是将元素存入TreeMap中key的位置,value位置使用占位符占位
TreeMap中先判断是否有外置比较器再判断内置比较器(说明外置比较器优先级高于内置比较器) TreeMap内部类Entry(二叉树)key value 父节点地址 左节点地址 父节点地址 红黑树
//Student实现了Comparable接口
TreeMap<Student, Integer> map = new TreeMap<Student, Integer>();
map.put(new Student("aaa",90),1);
map.put(new Student("bbb",60),2);
map.put(new Student("ccc",70),3);
map.forEach((student, integer) -> System.out.println(student+" - " + integer));
//Teacher未实现Comparable接口,唯有向TreeMap构造方法中添加外置比较器实现Teacher的比较
Comparator<Teacher> cmp = (Comparator<Teacher>) Comparator.comparingInt((Teacher o) -> o.getSalary());
TreeMap<Teacher, Integer> map = new TreeMap<>(cmp);
map.put(new Teacher("aaa", 2000),1);
map.put(new Teacher("bbb", 3000),2);
map.put(new Teacher("ccc", 2500),3);
map.forEach((teacher, integer) -> System.out.println(teacher + " - " + integer));
HashMap
(JDK1.7:一维数组+单向链表,头插法 JDK1.8:一维数组+单向链表+红黑树,尾插法)
默认长度为16,长度必须是2的幂
最大容量1<<30(十亿多)
默认负载因子0.75
添加put过程
获取key的hash值 -- hashCode()
通过hash值计算在数组中的下标
判断下标上是否有元素存在没有 -- 创建entry对象,存入数组中
有 -- 判断多个key是否相同 -- (hash)&&(== || equals)相同 -- 替换原value值
不同 -- 添加元素(JDK1.7头插法 , JDK1.8尾插法)
HashMap内部类Entry(单向链表)
key value hash next
Hash回环解决
如果出现了Hash回环,不应该怪HashMap,因为HashMap明确表示该类不是一个线程安全的类,多线程下应使用ConcurrentHashMap
使用线程安全的ConcurrentHashMap
多线程下使用HashMap可能出现的情况
一个线程不断添加元素,导致HashMap扩容
一个线程不断遍历元素(第一个线程在扩容期间发生了引用地址回环),当前线程遍历时就会出现脏数据
默认的负载因子为什么是0.75?
取得了时间与空间的平衡
负载因子过大,利用了空间,浪费了时间
负载因子过小,利用了时间,浪费了空间
减少Hash碰撞的方法?
重写equals和hashCode方法,equals底层为== 不重写就无法判断是否相同
为什么长度会是2的幂?(重要)
获取元素在数组的下标是 元素的hash值&数组长度-1
如果数组的长度不是2的幂,-1就会导致二进制中的某几位都是0,和元素的hash值做&运算,二进制上的某几位就永远是0,最终导致下标分布不均匀,浪费空间
为了优化哈希函数计算和解决哈希冲突的效率,以及提高HashMap在散列过程中的性能
散列桶的计算更高效:假设HashMap的容量是
capacity = 2^n
,那么capacity - 1
的二进制表示形式将是n
位全为1的数。例如,capacity = 16 (2^4)
,那么capacity - 1 = 15
的二进制表示是1111
。这种情况下,当计算元素在哪个桶时,可以使用元素的哈希码与capacity - 1
进行按位与(hash & (capacity - 1)
),而不需要执行昂贵的取模运算。因为在位运算中,与1进行与操作保持原值,与0进行与操作结果为0,这样可以快速计算得到桶的索引减少哈希冲突:当容量为2的幂时,哈希函数的取值范围与容量相对应,这样可以减少哈希冲突的概率。因为在容量为2的幂的情况下,哈希码的高位与低位信息都被保留,有助于均匀分布元素到不同的桶中,从而减少了哈希冲突的可能性
支持动态扩容:HashMap在元素数量超过容量的75%(负载因子)时,会自动进行扩容。而在容量为2的幂的情况下,扩容时只需简单地将哈希码的高位进行拼接,从而快速地将元素重新分布到新的桶中
HashMap什么时候扩容?
如果映射关系个数大于等于阈值 并且 当前下标上的元素不为null,就扩容
JDK1.7HashMap与JDK1.8HashMap的区别?
JDK1.7HashMap
数据结构:一维数组+单向链表
计算hash值:位运算
单项链表插值法:头插法JDK1.8HashMap
数据结构:
一维数组+单向链表--链表长度>8&&数组长度>64 -->一维数组+红黑树(目的:提高查询效率)
一维数组+红黑树--红黑树节点<6 --> 一维数组+单向链表
计算hash值:高16位^低16位(计算更加散列的hash值)
单项链表插值法:尾插法
JDK1.8HashMap为什么链表长度>8会转换位红黑树?
泊松分布,让储存使用合理