作者简介:大家好,我是smart哥,前中兴通讯、美团架构师,现某互联网公司CTO
联系qq:184480602,加我进群,大家一起学习,一起进步,一起对抗互联网寒冬
我们花了两篇文章讲述了泛型是什么以及有什么用:
- 作用于编译期,由编译器解析,是一种兼具类型约束和自动转型的代码模板
- 存入:约束存入的元素类型,将可能的类型错误提前到编译期
- 取出:编译自动转型,消除手动强转,极大降低ClassCastException的风险
泛型只是程序员和编译器的约定。
我们可以通过泛型告诉编译器自己的意图:
呐,我现在假定这个List只能存String,你帮我盯着点,后面如果不小心放错类型,在编译期报错提醒我。
当然,要想编译器帮我们约束类型,就必须按人家的规矩办事。就好比Spring明明告诉你默认读取resources/application.yml,你非要把配置文件命名为resources/config.yml当然就报错啦。
而泛型也有一套自己的规则,我们必须遵守这些规则才能让编译器按我们的意愿做出约束。
这些规则是谁定的呢?当然是JDK的那群秃子咯。
今天我们来学习泛型通配符。
在讲述通配符的语法规则时,我会尽量给出自己的理解,让大家更容易接受它们。另外需要说明的是,在泛型相关的文章里我们总是以List元素存入、取出举例子,是因为容器类是我们接触最多的,这样更好理解。实际上对于泛型类、泛型方法都是适用的,并不一定要是容器类。
简单泛型
JDK1.5以后,我们全面跨入泛型时代。
假设现在有一个需求:设计一个print方法打印任意类型的List。
你想显摆一下刚学的泛型,于是这样设计:
public class GenericClassDemo {
public static void main(String[] args) {
List<Integer> integerList = new ArrayList<>();
print(integerList);
}
public static void print(List<Integer> list) {
// 打印...
}
}
咋一看没问题,但需求是打印任意类型的List。目前的print()只能接收List<Integer>,你传List<String>会报错:
你想了想,Object是所有对象的父类,我改成List<Object>吧:
悲剧,这下连List<Integer>都不行了。这是为什么呢?我们来分析一下原因。
实际编码时,常见的错误写法如下:
// 错误写法1:间接传递(通常发生在方法传参,比如将stringList传给print(List<Object> list))
List<String> stringList = new ArrayList<>();
List<Object> list = stringList;
// 错误写法2:直接赋值
List<Object> list = new ArrayList<String>();
总之,list引用和实际指向的List容器类型必须一致(赋值操作左右两边的类型必须一致)。
JDK推荐的写法:
// 比较啰嗦的写法
List<String> list = new ArrayList<String>();
List<Object> list = new ArrayList<Object>();
// 省略写法,默认左右类型一致
List<String> list = new ArrayList<>();
List<Object> list = new ArrayList<>();
我们在前面已经了解到,泛型底层其实还是Object/Object[],所以上面的几种写法归根到底都是Object[]赋值给Object[],理论上是没有问题的。
那么我们不禁要问:既然底层都支持了,为什么编译器要禁止这种写法呢?
我们从一正一反两个角度来思考这个问题。
正向思考
首先,Object和String之间确实有继承关系,但List<Object>和List<String>没有,不能用多态的思维考虑这个问题(List和ArrayList才是继承/实现关系)。
其次,讨论泛型时,大家应该尽量从语法角度分析。
对于:
List<Object> list = new ArrayList<String>();
左边List<Object>的意思是希望编译器帮它约束存入的元素类型为Object,而右边new ArrayList<String>()则希望约束存入的类型为String,此时就会出现两个约束标准,而它们却是对同一个List的约束,是自相矛盾的。
反向思考
如果上面的论述还是缺乏说服力,那么我们干脆假设List<Object> list = new ArrayList<String>()是合法的,又会发生什么呢?
先来看看数组是怎么处理类似问题的:
数组底层和泛型不同,泛型底层都是Object/Object[],而数组是真的分别创建了Object[]和String[],而且允许String[]赋值给Object[]。但这不是它骄傲的资本,反而是它的弱点,给了异常可趁之机:
public static void main(String[] args) throws Exception {
// 直接往String[]存Integer会编译错误
String[] strings = new String[3];
strings[0] = "a";
strings[1] = "b";
strings[2] = 100; // COMPILE ERROR!
// 但数组允许String[]赋值给Object[]
Object[] objects = strings;
// 这样就能通过编译了,但运行期会抛异常:ArrayStoreException
objects[2] = 100;
}
数组允许String[]赋值给Object[],但却把错误被拖到了运行期,不容易定位。
同样的,如果泛型也允许这样的语法,那就和数组没区别了:
- 首先,ls.add(new Object())成功了,那就意味着之前List<String>所做的约束都白费了,因为StringList中混入了别的类型
- 其次,编译器仍会按String自动转型,会发生ClassCastException
这么看来,泛型强制要求左右两边类型参数一致真是明智的举措,直接把错误扼杀在编译期。
泛型的指向与存取
在之前介绍泛型时,我们观察的维度只有存入和取出,实际上泛型还有一个很重要的约束:指向。为什么之前不提这个概念呢?因为之前接触的泛型都太简单了,比如List<String>只能指向List<String>,也就是泛型左右两边类型必须一致,没什么好讲的。
另外,千万别以为List<Number>只能存Number类型的元素,只要是Number的子类型都是可以的。因为对于List<Number>来说,反正取出时会统一转向上转型为Number,很安全。
至此,我们完善了泛型最重要的两个概念:指向、存取。
对于简单泛型而言:
- List<Number>指向:只能指向List<Number>,左右两边泛型必须一致(所以简单泛型解决不了print(List<???> list)的通用性问题)
- List<Number>存入:可以存入Integer/Long/BigDecimal...等Number子类元素
- List<Number>取出:自动按Number转(存在多态,不会报错)
后面学习通配符时,也请大家时刻保持清醒,多想想当前list可以指向什么类型的List,可以存取什么类型的元素。如果你觉得上面的推演太绕了,那么就记住:简单泛型的左右两边类型必须一致。
通配符
既然泛型强制要求左右两边类型参数必须一致,是否意味着永远无法封装一个方法打印任意类型的List?如何既能享受泛型的约束(防止出错),又能保留一定的通用性呢?
答案是:通配符。
我把List<T>、BaseDao<T>这样的称为简单泛型,把extends、super、?称为通配符。而简单泛型和通配符组合后又可以得到更为复杂的泛型,比如? extends T、? super T、?等。简而言之,通配符可以用来调节泛型的指向和存取之间的矛盾。
比如,有时我们需要list能指向不同类型的List(希望print()方法能接收更多类型的List)、有时我们又希望泛型能约束元素的存入和取出。但指向和存取往往不可兼得,具体要选用哪种泛型,需要根据实际情况做决定。
extends:上边界通配符
通配符所谓的上边界、下边界其实是对“指向”来说的。比如
List<? extends Number> list = new ArrayList<Integer>();
extends是上边界通配符,所以对于List<? extends Number>,元素类型的天花板就是Number,右边List的元素类型只能比Number“低”。换句话说,List<? extends Number>只能指向List<Integer>、List<Long>等子类型List,不能指向List<Object>、List<String>。
记忆方法: List<? extends Number> list = ...,把?看做右边List的元素(暂不确定,用?代替),? extends Number表示右边元素必须是Number的子类。
你可能会问:
之前简单泛型List<Object>不能指向List<String>,怎么到了extends这就可以了。这不扯淡吗?
其实换个角度就是,Java规定简单泛型左右类型必须一致,但有些情况又要考虑通用性,所以又搞出了extends,允许List<? extends Number>指向子类型List。
之前我们假设过,如果允许简单泛型指向指向子类型List,那么存取会出问题:
现在extends通配符放宽了指向限制(List<? extends Human>允许指向List<Chinese>),是否意味着extends通配符也会发生强转错误呢?
卧槽,我以为有什么高招,结果用了extends后直接不让存了。不过想想,确实是无奈之举。
public static void main(String[] args) {
List<Integer> integerList = new ArrayList<>();
integerList.add(1);
List<Long> longList = new ArrayList<>();
longList.add(1L);
List<? extends Number> numberList = new ArrayList<>();
numberList = 随机指向integerList或longList等子类型List;
numberList.add(1); // 由于无法确定numberList指向哪个List,所以干脆禁止add(万一指向integerList,那么add(1L)就不合适了,取出时可能转型错误)
}
还不是很明白?那就再举个例子:
但是对于取出,extends可不含糊:
public static void main(String[] args) {
List<Integer> integerList = new ArrayList<>();
integerList.add(1);
List<Long> longList = new ArrayList<>();
longList.add(1L);
List<? extends Number> numberList = integerList; // 不管numberList指向integerList还是longList
Number number = numberList.get(0); // 取出来的元素都可以转Number,因为Long/Integer都是它子类
}
看到这,我们应该有所体会:对于泛型而言,指向和存取是两个不同的方向,很难同时兼顾。要么指向放宽,存取收紧;要么指向收紧,存取放宽。
extends小结:
- List<? extends Number>指向:Java允许extends指向子类型List,比如List<? extends Number>允许指向List<Integer>
- List<? extends Number>存入:禁止存入(防止出错)
- List<? extends Number>取出:由于指向的都是子类型List,所以按Number转肯定是正确的
相比简单泛型,extends虽然能大大提高指向的通用性,但为了防止出错,不得不禁止存入元素,也算是一种取舍。换句话说,print(List<? extends Number> list)对于传入的list只能做读操作,不能做写操作。
super:下边界通配符
super是下边界通配符,所以对于List<? super Integer>,元素类型的地板就是Integer,右边List的元素类型只能比Integer“高”。换句话说,List<? super Integer>只能指向List<Number>、List<Object>等父类型List。
记忆方法: List<? super Integer> list = ...,把?看做右边List的元素(暂不确定,用?代替),? super Integer表示右边元素必须是Integer的父类。
super的特点是:
- List<? super Integer>指向:只能指向父类型List,比如List<Number>、List<Object>
- List<? super Integer>存入:只能存Integer及其子类型元素
- List<? super Integer>取出:只能转Object
至此,我们发现Java同时满足了:
- extends:指向子类型List
- 简单泛型T:指向同类型List
- super:指向父类型List
说完指向问题,我们再来探讨一下存取问题。思路还是一样,既然Java允许List<? super Integer>指向List<Number>等父类型,那么如何防止存取出错呢?
假设存在class Human implement Swimming, Speaking,那么Swimming和Speaking都是Human的父类/父接口。由于List<? super Human>可以指向父类型List,要么指向SwimmingList,要么指向SpeakingList。
public static void main(String[] args) {
List<Swimming> swimmingList = new ArrayList<>();
// 假设加入了很多实现了Swimming接口的元素,比如Dolphin(海豚)
// swimmingList.add(dolphin)...
List<Speaking> speakingList = new ArrayList<>();
// 假设加入了很多实现了Speaking接口的元素,比如Parrot(鹦鹉)
// speakingList.add(parrot)...
List<? super Human> humanList = swimmingList / speakingList; // 指向随机的List
humanList.add(...) // 是否应该允许存入 Parrot(鹦鹉)?
}
此时对于List<? super Human>,是否应该允许加入 Parrot(鹦鹉)呢?答案是最好不要。因为humanList的指向是不确定的,如果刚好指向的是swimmingList,那么list.add(parrot)显然是不合适的。
只有存入Human及其子类才是安全的:
介绍完super的存入,最后聊聊super的取出。由于List<? super Human>可以指向任意Human父类型的List,可能是SwimmingList,也可能是SpeakingList。这意味取出的元素可能是Swimming,也可能是Speaking,是不确定的,所以用Swimming或Speaking都不太合适。
那能不能强转为Human呢?答案是不行。假设humanList指向的是swimmingList,而swimmingList里存的是Shark、Dolphin、Human,此时list.get(0)得到的是 Shark implements Swimming,强转为Human显然不合适。
super小结
- List<? super Human>指向:只能指向父类型List,比如List<Speaking>、List<Swimming>
- List<? super Human>存入:只能存Human及其子类型元素
- List<? super Human>取出:只能转Object
?:无界通配符
讲完最难的两个通配符,?就很简单了。它类似于List<? extends Object>,允许指向任意类型的List。
再分析一下存和取:
- 由于指向的List不确定,并且这些List没有共同的子类,所以找不到一种类型的元素,能保证add()时百分百不出错,所以禁止存入。
- 由于指向的List不确定,并且这些List没有共同的父类(除了Object),所以只能用Object接收。
通配符的使用场景
泛型本身比较复杂,能把简单的T用熟练的已经不多,更别说用上通配符了。但从语法本身来说,通配符就是为了让赋值更具通用性。原先泛型赋值只能是同类型之间赋值,不利于抽取通用方法。而使用通配符后,就可以在一定程度上开放赋值限制。
?是开放限度最大的,可指向任意类型List,但在对List的方法调用上也是限制最大的,具体表现在:
- 入参和泛型相关的都不能使用(禁止存入)
- 返回值和泛型相关的都只能用Object接收(只能强转为Object)
extends和super指向性各砍了一半,分别指向子类型List和父类型List,但方法使用上又相对开放了一部分:
- extends不允许存入,但取出时类型稍微精确些,可以往边界类型转
- super允许存入子类型元素,但取出时只能转为Object
所以如果要用到通配符,需要结合业务考虑,如果你只是希望造一个方法,接收任意类型的List,且方法内不调用List的特定方法,那就用?。而对于extends和super的取舍,《Effective Java》提出了所谓的:PECS(Producer Extends Consumer Super)
- 频繁往外读取内容的(向外提供内容,所以是Producer),适合用<? extends T>:extends返回值稍微精确些,对调用者友好
- 经常往里插入的(消耗数据,所以是Consumer),适合用<? super T>:super允许存入子类型元素
给大家举一个JDK对通配符的使用案例:
ArrayList中定义了一个addAll(Collection<? extends E> c)方法,我单独把这个方法拿出来:
class ArrayList<E> extends ... {
...
public boolean addAll(Collection<? extends E> c) {
Object[] a = c.toArray();
int numNew = a.length;
ensureCapacityInternal(size + numNew); // Increments modCount
System.arraycopy(a, 0, elementData, size, numNew);
size += numNew;
return numNew != 0;
}
}
以Person为例,假设是List<Person> list = new ArrayList<>(),那么这个方法就变成了:
public boolean addAll(Collection<? extends Person> c) {
Object[] a = c.toArray();
int numNew = a.length;
ensureCapacityInternal(size + numNew); // Increments modCount
System.arraycopy(a, 0, elementData, size, numNew);
size += numNew;
return numNew != 0;
}
此时,addAll()只能接收Person集合或者它的Person子类的集合,比如Student extends Person:
List<Person> personList = new ArrayList<>();
List<Student> studentList = new ArrayList();
personList.addAll(studentList)
为什么会选择extends呢?还是PECS原则,因为allAll()很显然是消费者场景,我更关心对参数的具体操作,而不怎么关心返回值(就是boolean提示操作成功与否)。这也是我日常使用通配符时的一个思路,PECS确实很实用。
最后,很多人会以为?等同于T,其实两者是有区别的。我们本质还是通过给T“赋值”来确定类型,只不过此时赋值给T的不再是某个具体的类型,而是某个“匹配规则”,帮助编译器确定向上、向下可以指向的List类型范围以及存取的元素类型限定。
强调
当你使用简单泛型时,首要考虑你想把元素规定为何种类型,顺便考虑子类型的存入是否会有影响(一般不会)。而如果要使用通配符,应该先考虑接收的范围,再考虑存取操作如何取舍(PECS原则)。
个人愚见是,通配符的出发点本来是为了解决指向问题,但开放指向后为了避免ClassCastException,不得已又对存取加了限制,实际开发时要灵活利用边界限制并结合实际需求选择合适的泛型。
提问:
- List list = new ArrayList(); 能添加各种类型的数据吗?
- List<Object> list = new Array<Integer>()会报错吗?为什么?
- 什么时候用?、extends、super?
- PECS是什么?
- List<?>和List<Object>的区别?
作者简介:大家好,我是smart哥,前中兴通讯、美团架构师,现某互联网公司CTO
进群,大家一起学习,一起进步,一起对抗互联网寒冬