集合特性(参考各路大神材料整理)
Collection
List
ArrayList
- 有序,可重复
- 底层使用数组
- 查询速度快(get() 、set ()),增删慢(add()、remove())
- 线程不安全
- 初始容量为10
- 扩容:当前容量*1.5倍 (默认最大容量MAX_ARRAY_SIZE: Integer.MAX_VALUE - 8)
(注:jdk1.6 当前容量 *1.5倍 +1
jdk7后为 当前容量 *1.5倍)
//扩容
int newCapacity = oldCapacity + (oldCapacity >> 1);
//最大容量判断
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
*********************************************************************************************
ArrayList 内部通过数组实现,因此可以对元素进行快速的随机访问。
但!数组的缺点是每个元素之间不能间隔,当数组大小不能满足需求时需要增加存储能力(即扩大到当前容量的1.5倍),就要将原数组复制到新的数组中。当在中间位置插入数据或删除数据时,需要对数组进行复制、移动,代价比较高。因此,查找遍历高效,插入删除较慢。
*********************************************************************************************
LinkedList
- 有序,可重复
- 底层使用双向循环链表数据结构
- 查询速度慢,增删快(add()、remove())
- 线程不安全
*********************************************************************************************
LinkedList用链表存储数据,适合数据的动态插入和删除,随机访问和遍历访问速度较慢。
另外,它还提供了List接口没有定义的方法,专门用于操作表头和表尾元素(getFirst()、getLast()、removeFirst()、removeLast()、addFirst(E e)、addLast(E e)),可以当做堆栈、队列和双向队列使用。
*********************************************************************************************
Vector
- 有序,可重复
- 底层使用数组
- 查询速度快,增删慢
- 线程安全,效率低
- 扩容:默认扩容一倍
*********************************************************************************************
Vector 与 ArrayList 一样,也是通过数组实现的,不同的是它支持线程的同步(使用synchronized),即某一时刻只有一个线程能够写 Vector,避免多线程同时写而引起的不一致性,但实现同步需要很高的花费,因此,访问它比访问 ArrayList 慢。
*********************************************************************************************
Set
HashSet
- 无序,不可重复
- 底层使用hash表
- 存取速度快
- 内部是HashMap
- 线程不安全
- 初始容量16
- 扩容因子:0.75(即当前元素个数超过容量的0.75倍时进行扩容)
- 扩容:原容量*2
*********************************************************************************************
哈希表里边存放的是哈希值。HashSet 存储元素的顺序并不是按照存入时的顺序,而是按照哈希值来存的,所以取数据也是按照哈希值取得。元素的哈希值是通过元素的hashcode 方法来获取的,HashSet先判断两个元素的哈希值,如果哈希值一样,接着会比较equals方法,如果equals方法结果为true, HashSet则认为两个元素为同一元素。如果equals方法为false就不是同一个元素。equals方法为false的元素存储是在同样的哈希值下顺延(即哈希值相同的元素放在同一个哈希桶中),即哈希一样的元素存一列。
*********************************************************************************************
TreeSet
- 无序,不可重复
- 底层使用二叉树实现
- 排序存储
- 内部是TreeMap的SortedSet
- 线程不安全
*********************************************************************************************
TreeSet()是使用二叉树的原理对新 add()的对象按照指定的顺序排序(升序、降序),每增
加一个对象都会进行排序,将对象插入的二叉树指定的位置。
Integer 和 String 对象都可以进行默认的 TreeSet 排序,而自定义类的对象是不可以的,自
己定义的类必须实现 Comparable 接口,并且覆写相应的 compareTo()函数,才可以正常使
用。
*********************************************************************************************
LinkedHashSet
- 使用Hash表存储,并用双向链表记录插入顺序
- 内部是LinkedHashMap
Queue
- 在两端出入的List,所以也可用数组或链表实现
Map
HashMap
- 键不可以重复,值可以重复
- 底层hash表
- 线程不安全
- key 和value 都可以为null
- 初始容量16
- 扩容因子:0.75(即当前元素个数超过容量的0.75倍时进行扩容)
- 扩容:原容量*2
- JDK7 实现方式为 数组+链表
- JDK8实现方式为 数组+链表+红黑树(链表大小超过8个,转换为红黑树;小于6个转换为链表)
//非二叉树阈值
static final int UNTREEIFY_THRESHOLD = 6;
//二叉树阈值
//为什么用两个阈值?防止频繁转换
static final int TREEIFY_THRESHOLD = 8;
//最小树形化阈值,
//即并不是链表过长就转为二叉树,
//只有数组容量大于阈值才链表才会转为二叉树
static final int MIN_TREEIFY_CAPACITY = 64;
*********************************************************************************************
HashMap根据键的HashCode值存储数据,大多数情况下可以快速定位到它的值,因此具有很快的访问速度,但遍历顺序不固定。HashMap最多只允许一条记录的键为null。HashMap非线程安全,可以通过Collections的synchronizedMap方法使HashMap线程安全。
*********************************************************************************************
ConcurrentHashMap
- 线程安全
- 使用分段锁(减小锁的粒度)
HashTable
- 键不可以重复,值可以重复
- 底层hash表
- 线程安全
- key 和 value都不可以为null
- 初始容量11
- 扩容因子:0.75(即当前元素个数超过容量的0.75倍时进行扩容)
- 扩容:原容量*2 + 1
int newCapacity = (oldCapacity << 1) + 1;
TreeMap
- 键不可以重复,值可以重复
- 底层二叉树
(未完待续)