一、Java集合框架概述
- 集合、数组都是对多个数据(对象)进行存储操作的结构,简称Java容器
- 说明:此时的存储,只要指的是内存层面的存储,不涉及到持久化的存储
- 数组在存储多个数据方面的特点
- 一旦初始化以后,其长度就确定了
- 数组一旦定义好了,其元素的类型也就确定了。所以我们只能去操作指定类型的数据了。如:String[] arr
- 数组在存储多个数据方面的缺点
- 一旦初始化以后,其长度就不可修改。
- 数组中提供的方法非常有限,对于添加、删除、插入数据等操作,非常不方便,同时效率不高
- 获取数组中实际元素的个数的需求,数组没有现成的属性或方法可用
- 数组存储数据的特点:有序,可重复。对于无序、不可重复的需求无法满足
- Java集合可分为Collection和Map两种体系
Collection接口
:单列数据,定义了存取一组对象的方法的集合
①List
:元素有序,可重复 ——>"动态"数组
②Set
:元素无序,不可重复 ——>高中讲【】的“集合”
Map接口
:双列数据,保存具有映射关系“key-value”的集合 ——>高中函数 y=f(x)
二、Collection接口方法
package collection;
import org.junit.Test;
import java.util.*;
/**
* @author ZC
* @Description 测试Collection接口中的方法
* @date 2020-07-03 18:31
*/
public class CollectionTest {
@Test
public void test(){
Collection coll = new ArrayList();
Collection coll1 = new ArrayList();
//1.add(Object o):将元素o添加到集合coll中
coll.add("AA");
coll.add("BB");
coll.add("123");
coll1.add(123);//自动装箱
coll1.add(new Date());
//2.addAll(Collection c):将c集合中的元素添加到当前的集合中
coll.addAll(coll1);
System.out.println(coll);
//3.size():获取添加到集合的元素的个数
System.out.println(coll.size());
//4.isEmpty():判断当前集合是否为空
System.out.println(coll.isEmpty());
//5.clear():清空集合元素
coll1.clear();
System.out.println(coll1.isEmpty());
//6.contains(Object obj):判断当前集合是否包含obj,
// 在判断时判断,会调用的是obj对象所在类的equals()方法
System.out.println(coll.contains("AA"));//true
System.out.println(coll.contains(new String("AA")));//true
//7.containsAll(Collection coll1):判断形参coll1的所有元素是否都存在于当前集合中
Collection coll2 = new ArrayList();
coll2.add("AA");
coll2.add("CC");
System.out.println(coll.containsAll(coll2));
//8.remove(Object obj): 先调用obj对象的equals()判断集合中是否存在该数据,如果有则从集合中移除
System.out.println(coll2.remove("CC"));
//9.removeAll(Collection coll1):从当前集合中移除coll1集合中的所有元素
System.out.println(coll);
coll.removeAll(coll2);
System.out.println(coll);
//10. retainAll(Collection coll1):交集:获取当前集合和coll1集合的交集,并返回给当前集合
coll1.retainAll(coll);
System.out.println(coll1);
//11. equals(Object obj):判断当前集合和形参集合的元素是否都相同
Collection coll3 = new ArrayList();
coll3.add("AA");
coll3.add("BB");
Collection coll4 = new ArrayList();
coll4.add("BB");
coll4.add("AA");
System.out.println(coll3.equals(coll4)); //false
//12.hashCode(): 返回当前对象的哈希值值
System.out.println(coll.hashCode());
//13. toArrat(): 集合 ———> 数组
Object[] objects = coll.toArray();
for (int i = 0; i < objects.length; i++) {
System.out.println(objects[i]);
}
//扩展:数组 ———> 集合
List<String> list = Arrays.asList(new String[]{"AA", "BB"});
System.out.println(list);
List<int[]> list1 = Arrays.asList(new int[]{123, 123});
System.out.println(list1.size()); //1
List<Integer> list2 = Arrays.asList(new Integer[]{123, 123});
System.out.println(list2.size()); //2
//14.iterator():返回Iterator的实例,用于遍历集合元素,在下面第三点
}
}
三、Iterator迭代器接口
集合元素的遍历操作(
遍历的是Collection
),使用Iterator(迭代器)接口
- hasNext():判断是否还有下一个元素
- next():①指针下移 ②将下移以后集合元素位置上的元素返回
注意:迭代器只是用来遍历集合中的元素,即迭代器本身是不存储数据的
- remove():可以在遍历的时候,删除集合中的元素。此方法不同于集合直接调用remove()
foreach底层使用的就是迭代器
package collection;
import org.junit.Test;
import java.util.ArrayList;
import java.util.Collection;
import java.util.Iterator;
/**
* @author ZC
* @Description 迭代器接口测试
* @date 2020-07-04 14:25
*/
public class IteratorTest {
@Test
public void test(){
Collection coll = new ArrayList();
coll.add("123");
coll.add(456);
coll.add(new String("Tom"));
coll.add(false);
/**
* 迭代器,搭配着hasNext()和next()方法使用
*/
Iterator iterator = coll.iterator();
while(iterator.hasNext()){
System.out.println(iterator.next());
}
/**
* remove() 方法
*/
iterator = coll.iterator();
while(iterator.hasNext()){
Object obj = iterator.next();
if ("Tom".equals(obj)){
iterator.remove();
}
}
}
}
四、Collection子接口 —— List
1. ArrayList的源码分析
作为List的主要实现类,线程不安全,效率高
- JDK7情况下
- 构造器:ArrayList list = new ArrayList(),底层创建了长度是10的Object[] 数组elementData
- 第一次调用添加操作,list.add(123) ——> elementData[0] = new Integer(123)
- 如果某次添加导致底层elementData数组容量不够,则扩容。默认情况下,扩容为原来容量的1.5倍,同时需要将原有数组中的数据复制到新的数组中。
- 结论:建议开发中使用带参的构造器:
ArrayList list = new ArrayList(int capacity)
- JDK8中ArrayList的变化
- 构造器:ArrayList list = new ArrayList(),底层Object[] 数组elementData初始化为{},并没有创建长度为10的数组
- 第一次调用添加操作,list.add(123) 时,底层才创建了长度为10的数组,并将数据123 添加到 elementData[0]
- 后续的添加和扩容操作与 JDK7 无异
- 小结:
JDK7 中ArrayList的对象的创建类似于单例模式的饿汉式;JDK8 中ArrayList的创建类似于单例模式的懒汉式,延迟了数组的创建,节省了内存。
2. LinkedList
- LinkedList list = new LinkedList(),内部声明了Node类型的first和last,默认值为null
- list.add(123),将123封装到Node中,创建了Node对象,然后通过prev和next连接到双向链表上
3. Vector
作为古老的实现类,线程安全,效率低,JDK1.0就有了
- Vector vector = new Vector(),底层创建了长度是10的Object[] 数组elementData
- 扩容:扩为原来容量的2倍.
ArrayList、LinkedList、Vector三者的异同:Java学习之路(三):不同结构的区别(更新中)中的第十二点
4.List接口的方法
5.总结List常用的方法
- 增:add(Object obj)
- 删:remove(int index) /remove(Object obj)
- 改:set(int index,Object obj)
- 查:get(int index)
- 插:add(int index,Object obj)
- 长度:size()
- 遍历:
①迭代器Iterator方式
②增强for循环(foreach)
③普通的循环
五、Collection子接口 —— Set
- Set接口概述
- Set接口是collection的子接口,Set接口没有提供额外的方法,即使用的方法都是Collection接口中的方法
- Set集合不允许包含相同的元素,如果试把两个相同的元素加入同一个Set集合中,则操作失败
- Set集合判断两个对象是否相同不是使用 == 运算符,而是根据equals()方法
- 对于存放在Set容器中的对象,
对应的类一定要重写equals()和hashCode(Object obj)方法,以实现对象相等原则。重写的两个方法要保持一致性,即:“相等对象必须拥有相等的散列码”
- 重写两个方法的小技巧:对象中用作equals()方法比较的field,都应该用来计算hashCode值。
1. HashSet(七上八下)
- HashSet是Set接口的典型实现,大多数时候使用Set结合时都使用这个实现类。
- HashSet按Hash算法来存储集合中的元素,因此具有很好的存取、查找、删除性能
- HashSet具有以下特点
- 不能保证元素的排列顺序
- HashSet不是线程安全的,即效率高
- 集合元素可以是null
HashSet集合判断两个元素相等的标准
:两个对象通过hashCode()方法比较相等,并且两个对象的equals()方法返回值也相等- HashSet底层存储结构:
数组+链表
以HashSet为例说明
- Set:存储无序、不可重复的数据
- 无序性:不等于随机性,存储的数据在底层数组中并非按照数组的索引的顺序添加的,而是根据数据的Hash值添加的
- 不可重复性:保证添加的元素按照equals()判断时,不能返回true,即相同元素只能添加一个
添加元素的过程
:以HashSet为例
- 我们想HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值,此哈希值接着通过某种算法计算出在HashSet底层数组中存放的位置(即为:索引位置),判断数组此位置上是否已经有元素:
- 如果此位置没有其他元素,则元素a添加成功 ——>
情况1
- 如果此位置有其他元素b(或以链表形式存在多个元素),则比较元素a与其他元素的哈希值是否相同:
- 如果哈希值不同,则元素a添加成功 ——>
情况2
- 如果哈希值相同,进而需要调用元素a所在类的equals()方法:
- equals()返回true,元素a添加失败
- equals()返回false,元素a添加成功 ——>
情况3
对于添加成功的
情况2和情况3
而言:元素a与已经存在指定索引位置上的元素以链表的形式存储(七上八下
)
- jdk7:元素a放到数组中,作为链表的表头
- jdk8:元素b接到链表后,作为链表的表尾
2. LinkedHashSet
- 作为
HashSet的子类
,遍历其内部数据时,可以按照添加的顺序去遍历 - 优点:对于频繁的遍历操作,LinkedHashSet效率高于HashSet
3. TreeSet
- TreeSet 是 SortedSet接口的实现类,TreeSet可以确保集合元素处于排序状态
- 内部实现
- TreeSet底层使用
红黑树
结构存储数据 向TreeSet中添加的数据,要求是同个类的对象
- 自然排序中,判断两个对象是否相同的标准为:compareTo()返回0,不再是equals()
- 定制排序中,判断两个对象是否相同的标准为:compare()返回0,不再是equals()
- TreeSet底层使用
- 新增的方法如下:(了解)
- Comparator comparator()
- Object first()
- Object last()
- Object lower(Object e)
- Object higher(Object e)
- SortedSet subSet(fromElement,toElement)
- SortedSet headSet(toElement)
- SortedSet tailSet(fromElement)
- TreeSet两种排序方法:
自然排序
和定制排序
。默认情况下,TreeSet采用自然排序(可以按照添加对象的指定属性进行排序)
六、Map接口
Map:双列数据,存储key-value对的数据
1. HashMap
- 作为Map的主要实现类;线程不安全,效率高,
能够存储null的key和value
——健壮性更好
- HashMap的底层:
- JDK7:
数组+链表
HashMap map = new HashMap():在实例化以后,底层创建了一个长度为16的一维数组Entry[] table
map.put(key1,value1):首先调用key1所在类的hashCode()计算key的哈希值,此哈希值通过某种算法计算以后,得到在Entry[]数组的位置
- 如果此位置上的数据为空,此时的key1-value1添加成功 ——>
情况1
- 如果此位置上的数据不为空,(意味着存在一个或多个数据(以链表的形式存储)),比较key1与已存在的数据的哈希值
- 如果哈希值不相同,key1-value1添加成功 ——>
情况2
- 如果哈希值相同,则调用key1所在类的equals()方法
- 如果equals()返回false:则key1-value1添加成功 ——>
情况3
- 如果equals()返回true:则使用value1替换相同key的value值(
修改功能
)补充:对于
情况2和情况3
,此时的key1-value1和原来的数据以链表的方式存储扩容(
当超出临界值且要存放数据的位置非空时
):默认的扩容方式是将容量扩为原来的2倍,并将原有数据复制过来
- JDK8:
数组+链表+红黑树
相较于JDK7在底层实现方面的不同
- new HashMap() :底层没有创建长度为16的数组
- jdk8底层的数组时Node[ ],而非Entry[ ]
- 首次调用put()方法时,底层创建一个长度为16的数组
- jdk7底层结构只有:
数组+链表
。JDK8中底层结构是:数组+链表+红黑树
,当数组的某一个索引位置上的元素以链表的形式存在的数据个数 > 8 且当前数组长度 > 64
时,此时此索引位置上的所有数据改为使用红黑树存储
2. LinkedHashMap
- 是HashMap的子类,保证在遍历map元素时,能够按照添加的顺序遍历
原因:在原有HashMap底层结构上,添加了一对引用,指向前一个和后一个元素- 对于频繁的遍历操作,此类的执行效率要高于HashMap
before和after就是用来记录添加的前后顺序的
3. TreeMap
- 是SortMap接口的实现类,保证按照添加的key-value对进行排序,实现排序遍历,此时考虑的是key的自然排序或定制排序
- 底层使用
红黑树
- 向TreeMap中添加key-value,要去key必须是同一个类创建的对象,因为要按照key进行排序:自然排序,定制排序
4. Hashtable
- 作为古老的实现类,线程安全,效率低,JDK1.0就有了
不能够存储null的key和value
5. Properties
常用来处理配置文件,它的key和value都是
String类型
- Properties类是Hashtable的子类,该对象用来处理属性文件
- 由于属性文件里的key和value都是字符串类型,
所以Properties里的key和value都是字符串类型
- 存取数据时,建议使用setProperty(String key,String value)方法和getProperty(String key)方法
Properties pros = new Properties();
pros.load(new FileInputStream("jdbc.properties"));
String user = pros.getProperties("user");
System.out.println(user);
6.Map接口的方法
- 总结: 常用方法
- 添加:put(Object key,Object value)
- 删除:remove(Object key)
- 修改:put(Object key,Object value)
- 查询:get(Object key)
- 长度:size()
- 遍历:Set keySet(),Collection values(),Set entrySet()
7.Map结构的理解
- Map中的key:无序,不可重复的,使用Set存储 ——> key所在的类要重写hashCode()和equals(),以HashMap为例
- Map中的value:无序,可重复的,使用Collection存储
- Map中的Entry:一个键值对(key-value)构成了一个Entry对象,无序,不可重复的,使用Set存储
七、Collections工具类
- Collections是一个操作
Set、List和Map
等集合的工具类(操作数组的工具了是Arrays) - Collections中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作,还提供了对集合对象设置不可变、对集合对象实现同步控制等方法
排序操作
:(均为static方法)- reverse(List):反转List中元素的顺序
- shuffle(List):对List集合元素进行随机排序
- sort(List):根据元素的自然顺序对指定List集合元素按升序排序
- sort(List,Comparator):根据指定的Comparator产生的顺序对List集合元素进行排序
- swap(List,int,int):将指定list集合中 i 处元素和 j 处元素进行交换
查找、替换
- Object max(Collection):根据元素的自然排序,返回给定集合中的最大元素
- Object max(Collection,Comparator):根据Comparator指定的顺序,返回给定集合中的最大元素
- Object min(Collection):据元素的自然排序,返回给定集合中的最小元素
- Object min(Collection,Comparator):根据Comparator指定的顺序,返回给定集合中的最小元素
- int frequency(Collection,Object):返回指定集合中指定元素出现的次数
- void copy(List dest,List src):将src中的内容复制的dest中
- boolean replaceAll(List list,Object oldVal,Object newVal):使用newVal替换List集合中所有oldVal
package collections;
import org.junit.Test;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Collections;
import java.util.List;
/**
* @author ZC
* @Description Collections工具类方法测试
* @date 2020-07-05 21:59
*/
public class CollectionsTest {
@Test
public void test(){
List list = new ArrayList();
list.add(123);
list.add(333);
list.add("asd");
list.add(1234);
//错误写法:java.lang.IndexOutOfBoundsException: Source does not fit in dest
// List list1 = new ArrayList();
// Collections.copy(list1,list);
//表中写法
List list1 = Arrays.asList(new Object[list.size()]);
System.out.println(list1);
Collections.copy(list1,list);
System.out.println(list1);
}
}
- Collections类中提供了多个
synchronizedXxx()
方法,该方法可使指定集合包装成线程同步的集合,从而可以解决多线程并发访问集合时的线程安全问题