视频链接:Java零基础教程
Java集合框架概述
一方面,面向对象语言对事物的体现都是以对象的形式,为了方便对多个对象的操作,就要对对象进行存储。另一方面,使用Array存储对象方面具有一些弊端,而Java集合就像一种容器,可以动态地把多个对象的引用放入容器中
数组在内存存储方面的特点:
- 数组初始化之后,长度就确定了
- 数组声明的类型,就决定了进行元素初始化时的类型
数组在存储数据方面的弊端: - 数组初始化以后,长度就不可变了,不便于扩展
- 数组中提供的属性和方法少,不便于进行添加、删除、插入等操作,且效率不高。同时无法直接获取存储元素的个数
- 数组存储的数据是有序的、可重复的。 --> 存储数据的特点单一
Java集合类可以用于存储数量不等的多个对象,还可用于保存具有映射关系的关联数组
Java集合可分为Collection和Map两种体系
Collection接口:单列数据,定义了存取一组对象的方法的集合
List:元素有序、可重复的集合
Set:元素无序、不可重复的集合
Map接口:双列数据,保存具有映射关系“key-value对”的集合
Collection接口继承树
Map接口继承树
Collection中常用的方法
常用方法 | 说明 |
---|---|
contains(Object obj) | 调用obj.equals方法进行比较 |
remove(Object obj) | 调用obj.equals方法进行比较 |
retainAll(Collection coll) | 保留与coll集合的交集 |
equals(Collection coll) | 比较两个集合是否相等,如果集合有序(如ArrayLIst)元素顺序需相同 |
hahCode() | 返回当前对象的哈希值 |
toArray() | 集合->数组 |
Arrays.asList(Object[] arrys) | 数组 -> 集合 |
iterator() | 返回Iterator接口,用于遍历 |
List arr1 = Arrays.asList(new int[] {123, 456});
System.out.println(arr1.size()); // 1
List arr2 = Arrays.asList(new Integer[] {123, 456});
System.out.println(arr2.size()); // 2
Iterator迭代器
Iterator对象成为迭代器(设计模式的一种),主要用于遍历Collection集合中的元素
迭代器模式,就是为容器而生
Collection接口继承了java.lang.Iterable接口,该接口有一个iterator()方法,那么所有实现了Collection接口的集合类都有一个iterator()方法,用以返回一个实现了Iterator接口的对象
Iterator仅用于遍历集合,Iterator本身并不提供封装对象的能力。如果需要创建Iterator对象,则必须有一个被迭代的集合
集合对象每次调用iterator()方法都得到一个全新的迭代器对象,默认游标都在集合的第一个元素之前
方法 | 说明 |
---|---|
next() | 下一个元素,没有下一个元素报异常NoSuchElementException |
hasNext() | 判断是否有下个元素 |
remove() | 删除集合中的元素 |
注意:如果还未调用next()或在上一次调动next方法之后已经调用了remove方法,在调用remove都会报IllegalStateException
新特性foreach
jdk 5.0 新增了foreach循环,用于遍历集合,数组
Collection coll = new ArrayList();
// for(集合元素的类型 局部变量:集合对象)
for(Object obj : coll) {
}
List
鉴于Java中数组用来存储数据的局限性,我们通常使用List替代数组
List集合类中元素有序、且可重复,集合中的每个元素都有其对应的顺序索引
List容器中的元素都对应一个整数型的序号记载其在容器中的位置,可以根据序号存取容器中的元素
JDK API中List接口的实现类常用的有:ArrayList、LinkedList和Vector
面试题:ArrayList、LinkedList、Vector三者的异同?
同:三个类都实现了List接口,存储数据的特点相同:存储有序的、可重复的数据
异:
ArrayList:作为List接口的主要实现类;线程不安全,效率高;底层使用Object[] elementData存储
LinkedList:对于频繁的插入、删除操作,使用此类效率比ArrayList高;底层使用双向链表存储 Node
Vector:作为List接口的古老实现类;线程安全的,效率低;底层使用Object[] elementData存储
ArrayList的源码分析
jdk 1.7 情况下
ArrayList list = new ArrayList(); // 底层创建了长度是10的Object[] 数据elementData
list.add(123); // elementData[0] = new Integer(123);
…
list.add(11); // 如果此时的添加导致底层elementData数组容量不够,则扩容
默认情况下,扩容为原来的容量的1.5倍,同时需要将原来数组中的数据复制到新的数组中
结论:建议开发中使用带参数的构造器:ArrayList list = new ArrayList(int capacity)
jdk 1.8 ArrayList的变化
ArrayList list = new ArrayList(); // 底层Object[] elementData初始化为{},并没有创建长度为10的数组
list.add(123); // 第一次调用add() 时,底层才创建了长度10的数组,并将数据123添加到elementData[0]
…
后续的添加和扩容操作与jdk 7无异
小结:jdk7中的ArrayList的对象的创建类似于单例的饿汉式,而jdk8中的ArrayList的对象的创建类似于单例的懒汉式,延迟了数组的创建,节省内存
LinkedList的源码分析
LinkedList list = new LinkedList(); // 内部声明了Node类型的first和last属性,默认值为null
list.add(123); // 将123封装到Node中,创建了Node对象
其中,Node定义为:体现了LinkedList的双向链表
private static class Node<E> {
E item;
Node<E> next;
Node<E> prev;
Node(Node<E> prev, E element, Node<E> next) {
this.item = element;
this.next = next;
this.prev = prev;
}
}
Vector的源码分析
jdk7和jdk8中通过Vector()构造器创建对象时,底层都创建了长度为10的数组
在扩容方面,默认扩容为原来的数组长度的2倍
List接口方法
List除了从Collection集合继承的方法外,List集合里添加了一些根据索引来操作集合元素的方法
方法 | 说明 |
---|---|
void add(int index, Object ele) | 在index位置插入ele元素 |
boolean addAll(int index, Collection eles) | 从index位置开始将eles中的所有元素添加进来 |
Object get(int index) | 获取指定index位置的元素 |
int indexOf(Object obj) | 返回obj在集合中首次出现的位置 |
int lastIndexOf(Object obj) | 返回obj在当前集合中末次出现的位置 |
Object remove(int index) | 移除指定index位置的元素,并返回此元素 |
Object set(int index, Object ele) | 设置指定index位置的元素为ele |
List subList(int fromIndex, int toIndex) | 返回从fromIndex到toIndex位置的子集合 |
总结:
方法 | 说明 |
---|---|
增 | add(Object obj) |
删 | remove(int index) / remove(Object obj) |
改 | set(int index, Object ele) |
查 | get(int index) |
插 | add(int index, Object ele) |
长度 | size() |
遍历 | ① Iterator迭代器方式 ② 增强for循环 ③ 普通的循环 |
Set
Set接口是Collection的子接口
Set接口没有提供额外的方法,使用的都是Collection中声明过的方法
Set集合不允许包含相同的元素,如果试把两个相同的元素加入同一个Set集合中,则添加操作失败
一、Set:存储无序的、不可重复的数据
以HashSet为例说明:
- 无序性:不等于随机性。存储的数据在底层数组中并非按照数组索引的顺序添加,而是根据数据的哈希值决定的
- 不可重复性:保证添加的元素按照equals()判断时,不能返回true。即:相同的元素只能添加一个
二、添加元素的过程:
以HashSet为例说明:
我们向HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值,此哈希值接着通过某算法计算出在HashSet底层数组中的存放位置(即为:索引位置),判断数组此位置上是否已经有元素:
–> 如果此位置上没有其他元素,则元素a添加成功 (情况一)
–> 如果此位置上有其他元素b(或以链表形式存在的多个元素),则比较元素a与元素b的hash值
–> --> 如果hash值不相同,则元素a添加成功 (情况二)
–> --> 如果hash值相同,进而需要调用元素a所在类的equals()方法
–> --> --> equals()返回true,元素a添加失败
–> --> --> equals()返回false,元素a添加成功 (情况三)
对于添加成功的 情况2 和 情况3 而言:元素a与已经存在指定索引位置上数据以链表的方式存储
jdk 7 :元素a放到数组中,指向原来的元素
jdk 8 :原来的元素放在数组中,指向元素a
总结:七上八下
面试题:HashSet、LinkedHashSet、TreeSet三者的异同?
HashSet:作为Set接口的主要实现类;线程不安全;可以存储null值
LinkedHashSet:作为HashSet的子类;遍历其内部数据时,可以按照添加的顺序遍历
TreeSet:可以按照添加对象的指定属性,进行排序
HashSet
HashSet底层结构(底层使用的是HashMap,将value放入到map的key上,map的value设为static new Object())
HashSet是Set接口的典型实现,大多数时候使用Set集合时都使用这个实现类
HashSet按Hash算法来存储集合中的元素,因此具有很好的存取、查找、删除性能
HashSet具有以下特点:
- 不能保证元素的排列顺序(存储位置的无序性)
- HashSet不是线程安全的
- 集合元素可以是null
HashSet集合判断两个元素相等的标准:两个对象通过hashCode() 方法比较相等,并且两个对象的equals() 方法返回也相等
对于存放在Set容器中的对象,对应的类一定要重写equals()和hashCode(Object obj)方法,以实现对象相等规则。即:”相等的对象必须具有相等的散列码“
重写两个方法的小技巧:对象中用作equals()方法比较的Field,都应该用来计算hashCode
LinkedHashSet
LinkedHashSet底层结构
LinkedHashSet作为HashSet的子类,在添加数据的同时,每个数据还维护了两个引用,记录此数据前一个数据和后一个数据
优点:对于频繁的遍历操作,LinkedHashSet效率高于HashSet
TreeSet
- 向TreeSet中添加的数据,要求是相同类的对象
- 两种排序方式:自然排序和定制排序
- 自然排序中,比较两个对象是否相同的标准为:compareTo() 返回0,不再是equals()
- 定制排序中,比较两个对象是否相同的标准为:compare() 返回0,不再是equals()
TreeSet数据结构
红黑树:https://www.yycoding.xyz/post/2014/3/27/introduce-red-black-tree
面试题:
HashSet set = new HashSet();
Person p1 = new Person(1001, "AA"); // Person重写equals、hashCode方法
Person p2 = new Person(1002, "BB");
set.add(p1);
set.add(p2);
System.out.println(set);
p1.name = "CC";
set.remove(p1); // hashCode变了,没有移除set中的p1
set.add(new Person(1001, "CC"));
System.out.println(set.size()); // 3
set.add(new Person(1001, "AA"));
System.out.println(set.size()); // 4
Map
双列数据,存储key-value对的数据 — 类似于高中的函数:y = f(x)
HashMap :作为Map的主要实现类;线程不安全的;效率高;可以存储null的key和value
LinkedHashMap :HashMap子类,保证遍历map元素时,可以按照添加的顺序实现遍历。原因:在原有的HashMap底层接口基础上,添加了一对指针,指向前一个和后一个元素。对于频繁的遍历操作,此类执行效率高于HashMap :保证按照添加的key-value对进行排序,实现排序遍历。此时考虑key的自然排序和定制排序。底层使用红黑树
Hashtable(t小写) :作为古老的实现类;线程安全的;效率低;不可以存储null的key和value
Properties :Hashtable的子类,常用来处理配置文件。key和value都是String类型
Map结构的理解:
Map中的key:无序的、不可重复的,使用Set存储所有的key --> key所在的类要重写equals()和hashCode() (以HashMap为例)
Map中的value:无序的、可重复的,使用Collection存储所有的value --> value所在的类要重写equals()
一个键值对:key-value构成了一个Entry对象
Map中的entry:无序的、不可重复的,使用Set存储所有的entry
常用方法:
方法 | 说明 |
---|---|
添加、删除、修改操作 | - |
Object put(Object key, Object value) | 将指定key-value添加到(或修改)当前map对象中 |
void putAll(Map m) | 将m中的所有key-value对存放到当前map中 |
Object remove(Object key) | 移除指定key的key-value对,并返回value |
void clear | 清空当前map中的所有数据 |
元素查询的操作 | - |
Object get(Object key) | 获取指定key对应的value |
boolean containsKey(Object key) | 是否包含指定的key |
boolean containsValue(Object value) | 是否包含指定的value |
int size() | 返回map中key-value对的个数 |
boolean isEmpty() | 判断当前map是否为空 |
boolean equals(Object obj) | 判断当前map和参数对象obj是否相等 |
元视图操作的方法 | - |
Set keySet() | 返回所有key构成的Set集合 |
Collection values() | 返回所有value构成的Collection集合 |
Set entrySet() | 返回所有key-value对构成的Set集合(主要用于遍历) |
总结:
方法 | 说明 |
---|---|
增 | put(Object key, Object value) |
删 | remove(Object key) |
改 | put(Object key, Object value) |
查 | get(Object key) |
长度 | size() |
遍历 | keySet() / value() / entrySet() |
HashMap
HashMap的底层:
- 数组 + 链表 (jdk 7及之前)
- 数据 + 链表 + 红黑树 (jdk 8)
HashMap的底层实现原理?以jdk 7 为例说明:
HashMap map = new HashMap();
在实例化以后,底层创建了长度是16的一维数组Entry[] table
—可能已经执行过多次put—
map.put(key1, value1);
首先,调用key1所在类的hashCode()计算key1哈希值,此哈希值经过某种算法计算以后,得到在Entry数组中的存放位置
–> 如果此位置上的数据为空,此时key1-value1(Entry)添加成功 (情况一)
–> 如果此位置上的数据不为空(意味着此位置上存在一个或多个数据(以链表形式存在)),比较key1和已经存在的一个或多个数据的哈希值:
–> --> 如果key1的哈希值与已经存在的数据的哈希值都不相同,此时key1-value1添加成功 (情况二)
–> --> 如果key1的哈希值与已经存在的某一个数据(key2-value2)的哈希值相同,继续比较:调用key1所在类的equals()方法,比较:
–> --> --> 如果equals()返回false:此时key1-value1添加成功 (情况三)
–> --> --> 如果equals()返回true:使用value1替换value2
关于情况二和情况三:此时key1-value1和原来的数据以链表的方式存储
在不断的添加过程中,会涉及到扩容问题,默认的扩容方式:扩容为原来容量的2倍,并将原来的数据复制过来
jdk 8 相较于 jdk 7在底层实现方面的不同:
- new HashMap() :底层没有创建一个长度为16的Entry数组,put时创建
- jdk 8 底层的数组是:Node[],而非Entry[]
- 首次调用put()方法时,底层创建长度为16的数组
- jdk 7底层结构方法只有:数组 + 链表。jdk 8中底层结构:数组 + 链表 + 红黑树 当数组的某一个索引位置上的元素以链表形式存在的数据个数 >= 8 且当前数组的长度 > 64时,此时此索引位置上的所有数据改为使用红黑树存储
面试题:
- HashMap的底层实现原理?
- HashMap 和 HashTable 的异同?
- ConcurrentHashMap 与 Hashtable 的异同?
HashMap源码中的重要常量
名称 | 说明 |
---|---|
DEFAULT_INITIAL_CAPACITY | HashMap的默认容量:16 |
MAXIMUM_CAPACITY | HashMap的最大支持容量,2^30 |
DEFAULT_LOAD_FACTOR | HashMap的默认加载因子 |
TREEIFY_THRESHOLD | Bucket中链表长度大于该默认值,转化为红黑树 |
UNTREEIFY_THRESHOLD | Bucket中红黑树存储的Node小于该默认值,转化为链表 |
MIN_TREEIFY_CAPACITY | 桶中的Node被树化时最小hash表容量。(当桶中Node的容量大到需要变红黑树时,若hash表容量小于MIN_TREEIFY_CAPACITY时,此时应执行resize扩容操作这个MIN_TREEIFY_CAPACITY的值至少是TREEIFY_THRESHOLD的4倍) |
table | 存储元素的数组,总是2的n次幂 |
entrySet | 存储具体元素的集 |
size | HashMap中存储的键值对的数量 |
modCount | HashMap扩容和结构改变的次数 |
threshold | 扩容的临界值,=容量*填充因子 |
loadFactor | 填充因子 |
LinkedHashMap
static class Entry<K,V> extends HashMap.Node<K,V> {
Entry<K,V> before, after; // 能够记录添加的元素的先后顺序
Entry(int hash, K key, V value, Node<K,V> next) {
super(hash, key, value, next);
}
}
TreeMap
向TreeMap中添加key-value,要求key必须是由同一个类创建的对象
因为要按照key进行排序:自然排序、定制排序
Hashtable
Hashtable是个古老的Map实现类,JDK 1.0就提供了。不同于HashMap,Hashtable是线程安全的
Hashtable实现原理和HashMap相同,功能相同。底层都是用哈希表结构,查询速度快,很多情况下可以互用
与HashMap不同,Hashtable不允许使用null作为key和value
与HashMap一样,Hashtable也不能保证其中Key-Value对的顺序
Hashtable判断两个key相等、两个value相等的标准,与HashMap一致
Properties
Properties类是Hashtable的子类,该对象用于处理属性文件
由于属性文件里的key、value都是字符串类型,所以Properties里的key和value都是字符串类型
存取数据时,建议使用setProperty(String key, String value)方法和getProperty(String key)方法
Collections工具类
Collections 是一个操作 Set、List 和 Map 等集合的工具类
Collections中提供了一系列静态的方法对集合元素进行排序、查询和修改操作,还提供了对集合对象设置不可变、对集合对象实现同步控制等方法
方法 | 说明 |
---|---|
排序操作 | 均为static方法 |
reverse(List) | 反转List中元素的顺序 |
shuffle(List) | 对List集合元素进行随机排序 |
sort(List) | 根据元素的自然排序对指定List集合元素按升序排序 |
sort(List, Comparator) | 根据指定的Comparator产生的顺序对List集合元素进行排序 |
swap(List, int, int) | 将指定list集合中的i处元素和j处元素进行交换 |
查找替换 | - |
Object max(Collection) | 根据元素的自然排序,返回给定集合中的最大元素 |
Object max(Collection, Comparator) | 根据Comparator指定的顺序,返回给定集合中的最大元素 |
Object min(Collection) | 根据元素的自然排序,返回给定集合中的最小元素 |
Object min(Collection, Comparator) | 根据Comparator指定的顺序,返回给定集合中的最小元素 |
int frequency(Collection, Object) | 返回指定集合中指定元素的出现次数 |
void copy(List dest, List src) | 将src中的内容复制到dest中 |
boolean replaceAll(List list, Object oldVal, Object newVal) | 使用新值替换List对象的所有旧值 |
同步控制 | 均为static方法 |
Collections类中提供了多个synchronizedXxx()方法,该方法可使将指定集合包装成线程同步的集合,从而可以解决多线程并发访问集合时的线程安全问题 | - |
synchronizedCollection(Collection) | - |
synchronizedList(Collection) | - |
synchronizedMap(Collection) | - |
synchronizedSet(Collection) | - |
synchronizedSortedMap(Collection) | - |
synchronizedSortedSet(Collection) | - |
面试题:Collection和Collections的区别?
copy方法的使用:
List list = new ArrayList<>();
list.add(123);
list.add(43);
list.add(765);
list.add(-97);
list.add(0);
// List dest = new ArrayList();
// Collections.copy(dest, list); // IndexOutOfBoundsException: Source does not fit in dest
List dest = Arrays.asList(new Object[list.size()]);
Collections.copy(dest, list);
同步控制:
List list1 = Collections.synchronizedList(list); // 返回线程安全的的list