Java集合框架分析

目录结构

  1. 集合
  2. 集合框架图
  3. Collection接口
  4. Iterator接口
  5. ListIterator接口
  6. AbstractCollection抽象类
  7. List接口
  8. Set接口
  9. Map接口
  10. 集合处理(阿里Java开发手册)

Java有一套基于不同数据结构封装成用于存储对象的集合框架,并且提供了相应的调用方法。集合框架结构复杂,故在此分析记录。


集合

集合存储对象并提供操作方法,底层是Object数组,使用时常加泛型限定类型保证安全。

集合分为List、Set、Map三大类型,分别对应有重复元素、无重复元素、映射关系三大特点。


集合框架图

集合框架图


Collection接口

AbstractCollection抽象类和List接口、Set接口的父类。因为继承了Iterable接口,故所有实现类都可用foreach方法。

可由Map.values返回得到,可生成向后迭代的Iterator类。


Iterator接口

由Collection接口的所有实现类调用iterator方法得到。能够以迭代方式逐个向后访问集合中的元素,并安全的除去适当的元素。

boolean hasNext():判断是否存在下一个可访问元素。
E next():返回集合中下一个元素。

ListIterator接口

继承了Iterator接口,由List接口的所有实现类调用listIterator方法得到。

能够以迭代方式向前或向后访问集合中的元素,在Iterator接口基础上新增了hasPrevious、previous等常用方法。

boolean hasPrevious():判断是否存在上一个可访问元素。
E previous():返回集合中上一个元素。

AbstractCollection抽象类

继承了Collection接口,提供了Collection接口除iterator和size以外所有方法的基本实现。

可以继承该类实现iterator和size后达到迭代效果。


List接口

元素有序、可以重复的集合类。

继承了Collection接口,并新增了List专有的抽象方法,比如listIterator方法生成ListIterator迭代器。

可由Arrays.asList方法生成,有ArrayList、LinkedList、Vector等常用实现类。

  • ArrayList

底层是Object数组(支持自动扩容),继承了AbstractList抽象类,实现了RandomAccess接口,支持随机访问,适用于频繁查找、修改的情景。

  • LinkedList

底层是双向链表,继承了AbstractSequentialList抽象类,适用于频繁增加、删除的情景。

  • Vector

同步的ArrayList。


Set接口

元素不可重复的集合类。继承了Collection接口,无Set专有抽象方法。

可由Map.keySet方法生成,有HashSet、TreeSet、LinkedHashSet等常用实现类。

注意:元素的不可重复等特点由对应的Map支持,元素存储在Map的key,对应的value是统一的final object;重写放入Set的对象equals和hashCode方法。

  • HashSet

底层是哈希表(实际是HashMap支持),继承了AbstractSet抽象类,实现了Set接口,适用于快速查找。

  • TreeSet

底层是红黑树(实际是TreeMap支持),继承了AbstractSet抽象类,实现了SortedSet接口,适用于需要排序的情景。

  • LinkedHashSet

底层是哈希表加双向链表(实际是LinkedHashMap支持),继承了HashSet类,适用于记录访问顺序(get/set改变排序(Java核心技术卷一))和快速迭代。


Map接口

元素不可重复的映射集合。没有父类接口。

  • HashMap

底层是哈希表,继承了AbstractMap抽象类,实现了Map接口,适用于快速查找。

  • TreeMap

底层是红黑树,继承了AbstractMap抽象类,实现了SortedMap接口,适用于需要排序的情景。

  • LinkedHashMap

底层是哈希表加双向链表,继承了HashMap类,适用于记录访问顺序(get/set改变排序(Java核心技术卷一))和快速迭代。

  • WeakHashMap

系统中存储一张HashMap,当表中的元素不存在其他引用时,gc回收期可以在特定时期回收该元素。

  • IdentityHashMap

集合处理(阿里Java开发手册)

1、关于hashCode和equals的处理,遵循如下规则:

1)只要重写equals,就必须重写hashCode。

2)因为Set存储的是不重复的对象,依据hashCode和equals进行判断,所以Set存储的对象必须重写这两个方法。

3)如果自定义对象作为Map的键,那么必须重写hashCode和equals。

说明: String重写了hashCode和equals方法,所以可以直接拿String对象作为key来使用。


2、ArrayList的subList结果不可强转成ArrayList,否则会抛出ClassCastException异常,即java.util.RandomAccessSubList cannot be cast to java.util.ArrayList。

说明: sbuList返回的是ArrayList的内部类SubList,并不是ArrayList而是ArrayList的一个视图,对于SubList子列表的所有操作最终会反映到原列表上。

3、在subList场景中,高度注意对原集合元素的增加或删除,均会导致子列表的遍历、增加、删除产生ConcurrentModificationException异常。


4、使用集合转数组的方法,必须使用集合的toArray(T[] array),传入的是类型完全一样的数组,大小就是list.size()。

说明: 使用toArray带参方法,入参分配的数组空间不够大时,toArray方法内部将重新分配内存空间,并返回新数组地址;

如果数组元素个数大于实际所需,下标为[list.size()]的数组元素将被设置为null,其他数组元素保持原值,因此最好将方法入参数组大小定义与几何元素个数一致。

正例:

	List<String> list = new ArrayList<String>(2);
	list.add("guan");
	list.add("bao");
	String[] array = new String[list.size()];
	array = list.toArray(array);

反例

直接使用toArray无参方法存在问题,此方法返回值只能是Object[]类,若强转其他类型数组将出现ClassCastException错误。


5、使用工具类Arrays.asList()把数组转换成集合时,不能使用其修改集合相关的方法,它的add、remove、clear方法会抛出UnsupportedOperationException异常。

说明: asList的返回对象是一个Arrays内部类,并没有实现集合的修改方法。Arrays.asList体现的是适配器模式,只是转换接口,后台数据仍是数组。

String[] str = new String[]{"you","wu"};
List list = Arrays.asList(str);
第一种情况:list.add("yangguanbao");运行时异常。
第二种情况:str[0] = "gujin";那么list.get(0)也会随之修改。

6、泛型通配符<? extends T>来接收返回的数据,此写法的泛型集合不能使用add方法,而<? super T>不能使用get方法,作为接口调用赋值时易出错。

说明: 扩展说一下PECS(Producer Extends Consumer Super)原则

  1. 频繁往外读取内容的,适合用<? extends T>。
  2. 经常往里插入的,适合用<? super T>。

7、不要在foreach循环里进行元素的remove、add操作。remove元素请用Iterator方式,如果并发操作,需要对Iterator对象加锁。

正例:

List<String> list = new ArrayList<>();
list.add("1");
list.add("2");
Iterator<String> iterator = list.iterator();
while(iterator.hasNext()){
	String item = iterator.next();
		if(删除的条件){
			iterator.remove();		
		}
}

反例:

for(String item : list){
	if("1".equals(item)){
		list.remove(item);
	}	
}

说明: 如果把上边的1换成2会出现ConcurrentModificationException异常。

9、【推荐】集合泛型定义时,在JDK7及以上,使用diamond语法或全省略。
说明:菱形泛型,既diamond,直接使用<>来指代前边已经指定的类型。

正例:

	//<>diamond方式
	HashMap<String,String> userCache = new HashMap<>(16);
	//全省略方式
	ArrayList<User> users = new ArrayList(10);

10、【推荐】集合初始化时,指定集合初始值大小。

说明: ashMap使用HashMap(int initalCapacity)初始化。

正例:

initialCapacity=(需要存储的元素个数/负载因子)+1。

注意负载因子(即loaderfactor)默认为0.75,如果暂时无法确定初始值大小,请设置为16(即默认值)。

反例:

HashMap需要放置1024个元素,由于没有设置容量初始大小,随着元素不断增加,容量7次被迫扩大,resize需要重建hash表,严重影响性能。


11、【推荐】使用entrySet遍历Map类集合KV,而不是KeySet方式进行遍历。

说明: keySet其实是遍历了2次,一次是转为Iterator对象,另一次是从HashMap中取出key所对应的value。

而entrySet只是遍历了一次就把key和value都放到了entry中,效率更高。如果是JDK8,使用Map.foreach方法。

正例:

values()返回的是V值集合,是一个List集合对象;keySet()返回的是K值集合,是一个Set集合对象;

entrySet()返回的是K-V值组合集合。


12、【推荐】高度注意Map类集合K/V能不能存储null值的情况,如下表格:

集合类KeyValueSuper说明
HashTable不允许为null不允许为nullDictionary线程安全
ConcurrentHashMap不允许为null不允许为nullAbstractMap锁分段技术(JDK8:CAS)
TreeMap不允许为null允许为nullAbstractMap线程不安全
HashMap允许为null允许为nullAbstractMap线程不安全

说明: 由于HashMap的干扰,很多人认为ConcurrentHashMap是可以置入null值,事实上存储null时会抛出NPE异常。


13、【参考】合理利用好集合的有序性(sort)和稳定性(order),避免集合的无序性(unsort)和不稳定性(unorder)带来的负面影响。

说明: 有序性是指遍历的结果是按某种比较规则依次排列的。稳定性指集合每次遍历的元素次序是一定的。如:TreeSet是sort/order;ArrayList是unsort/order;HashMap是unsort/unorder;


14、【参考】利用Set元素唯一的特性,可以快速对一个集合进行去重操作,避免使用List的contains方法进行遍历、对比、去重操作。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值