本篇目录结构
0、引子
你没看错,这个题目是2021年写下的。Android现在主推Kotlin,还有Flutter的Dart语言,还有必要深扣“过气的”Java吗?当然还是要学的,今天第一篇先总结泛型相关的知识点,后期会做一个系列出来:
- SDK还是改成Java,Kotlin也需要编译成为Java运行;
- 目前大量的第三方库和继承与接手公司既有代码都是Java所写的;
- Java语言应用不仅仅在Android,在后台开发中也是一个最流行的语言;
- 大公司面试都要求我们有扎实的Java语言基础。
所以,请大家不要轻视提高自己Java基础的机会,请大家认真学习,做好笔记,争取取得更大的进步。
接下来将从如下几个点切入总结:
1、我们为什么需要泛型?
在我们的实际工作中泛型是无处不在的,我们也写过不少,看到的更多,如,源码、开源框架……随处可见。但是,我们真正理解泛型吗?理解多少呢?举个栗子:
public int addInt(int x, int y){
return x + y;
}
public float addFloat(float x, float y){
return x + y;
}
实际开发中,经常有数值类型求和的需求,例如实现int类型的加法,有时候还需要实现long
类型的求和,如果还需要double
类型的求和,需要重新在重载一个输入是double
类型的add()
方法。
再来一个栗子:
public static void main(String[] args) {
List<String> list = new ArrayList();
list.add("string123");
list.add("stringabc");
//list.add(100);
for (int i = 0; i < list.size(); i++) {
String value = list.get(i); // 1
System.out.println("value:" + value);
}
}
定义了一个List
类型的集合,先向其中加入了两个字符串类型的值,随后加入一个int类型的值。这是完全允许的,因为此时list默认的类型为Object
类型。在之后的循环打印中,由于忘记了之前在list中也加入了int类型的值或其他编码原因,很容易出现类似于//1中的错误。因为编译阶段正常,而运行时会出现java.lang.ClassCastException
异常。因此,导致此类错误编码过程中不易发现。
在如上的编码过程中,我们发现主要存在两个问题:
- 当我们将一个对象放入集合中,集合不会记住此对象的类型,当再次从集合中取出此对象时,改对象的编译类型变成了
Object
类型,但其运行时类型仍然为其本身类型。 - 因此,//1处取出集合元素时需要人为的强制类型转化到具体的目标类型,且很容易出现
java.lang.ClassCastException
异常。
所以泛型的好处就是:
- 增加代码复用性,适用于多种数据类型执行相同的代码;
- 消除类型转换,泛型中的类型在使用时指定,不需要强制类型转换;
- 在编译时进行更强的类型检查。
2、泛型的定义
Java 泛型(Generics)是 JDK 5 中引入的一个新特性,泛型提供了编译时类型安全检测机制,该机制允许程序员在编译时检测到非法的类型。即“参数化类型”,一提到参数,最熟悉的就是定义方法时有形参,然后调用此方法时传递实参。那么参数化类型怎么理解呢?
顾名思义,就是将类型由原来的具体的类型参数化,类似于方法中的变量参数,此时类型也定义成参数形式(可以称之为类型形参),然后在使用/调用时传入具体的类型(类型实参)。
泛型的本质是为了参数化类型(在不创建新的类型的情况下,通过泛型指定的不同类型来控制形参具体限制的类型)。也就是说在泛型使用过程中,操作的数据类型被指定为一个参数,这种参数类型可以用在类、接口和方法中,分别被称为泛型类、泛型接口、泛型方法。
2.1 泛型类
引入一个类型变量T(其他大写字母都可以,不过常用的就是T,E,K,V等等,),并且用<>
括起来,并放在类名的后面。
- E - Element (在集合中使用,因为集合中存放的是元素)
- T - Type(Java 类)
- K - Key(键)
- V - Value(值)
- N - Number(数值类型)
- ? - 表示不确定的Java类型
public class NormalGeneric<T> {
private T data;
public NormalGeneric() {
}
public NormalGeneric(T data) {
this();
this.data = data;
}
//...
}
泛型类是允许有多个类型变量的。又如:
public class NormalGeneric2<T, K> {
private T data;
private K result;
public NormalGeneric2() {
}
//...
}
2.2 泛型接口
泛型接口与泛型类的定义基本相同。
public interface Genertor<T> {
public T next();
}
而实现泛型接口的类,有两种实现方法:
2.2.1 未传入泛型实参时
public class ImplGenertor<T> implements Genertor<T> {
@Override
public T next() {
return null;
}
}
在new出类的实例时,需要指定具体类型:
public static void main(String[] args) {
NormalGeneric<String> normalGeneric = new NormalGeneric<>();
//...
}
2.2.2 传入泛型实参
在new出类的实例时,和普通的类没区别。
public class ImplGenertor2 implements Genertor<String> {
@Override
public String next() {
return "success";
}
}
3、泛型方法解析
泛型方法,是在调用方法的时候指明泛型的具体类型 ,泛型方法可以在任何地方和任何场景中使用,包括普通类和泛型类。
public class GenericMethod {
public <T> T genericMethod(T...a){// public 修饰符, <T>返回值
return a[a.length/2];
}
public void test(int x,int y){
System.out.println(x+y);
}
public static void main(String[] args) {
GenericMethod genericMethod = new GenericMethod();
genericMethod.test(13, 25);
System.out.println(genericMethod.<String>genericMethod("English", "Chinese", "American"));
System.out.println(genericMethod.genericMethod(12,34));
}
}
注意泛型类中定义的普通方法和泛型方法的区别。
3.1 普通方法
// 这个类是个泛型类
public class Generic<T>{
private T key;
public Generic(T key) {
this.key = key;
}
// 虽然在方法中使用了泛型,但是这并不是一个泛型方法。
// 这只是类中一个普通的成员方法,只不过他的返回值是在声明泛型类已经声明过的泛型。
//所以在这个方法中才可以继续使用 T 这个泛型。
public T getKey(){
return key;
}
/**
* 这个方法显然是有问题的,在编译器会给我们提示这样的错误信息"cannot reslove symbol E"
* 因为在类的声明中并未声明泛型E,所以在使用E做形参和返回值类型时,编译器会无法识别。
*/
// public E setKey(E key){
// this.key = key;
// }
}
3.2 泛型方法
/**
* 这才是一个真正的泛型方法。
* 首先在public与返回值之间的<T>必不可少,这表明这是一个泛型方法,并且声明了一个泛型T
* 这个T可以出现在这个泛型方法的任意位置。
* 泛型的数量也可以为任意多个
* 如:public <T,K> K showKeyName(Generic<T> container){
* ...
* }
*/
public <T> T showKeyName(Generic<T> container) {
System.out.println("container key:" + container.getKey());
T res = container.getKey();
return res;
}
4、限定类型变量
有时候,我们需要对类型变量加以约束,比如计算两个变量的最小、最大值。
public static <T> T min(T a, T b) {
// 编辑器会给compareTo标红示错
if(a.compareTo(b)>0) return a; else return b;
}
请问,如果确保传入的两个变量一定有compareTo()
方法?那么解决这个问题的方案就是将T
限制为实现了Comparable
接口的类
public static <T extends Compareble> T min(T a, T b) {
if(a.compareTo(b)>0) return a; else return b;
}
T extends Comparable
中,T
表示应该绑定类型的子类型,Comparable
表示绑定类型,子类型和绑定类型可以是类也可以是接口。
如果这个时候,我们试图传入一个没有实现接口Comparable
的类的实例,将会发生编译错误。
public static <T extends Compareble> T min(T a, T b) {
if(a.compareTo(b)>0) return a; else return b;
}
public static <T extends Compareble & Serializable> T max(T a, T b) {
if(a.compareTo(b)>0) return a; else return b;
}
static class Test{
}
public static void main(String[] args) {
System.out.println(ArrayAlg.min("AA", "BB"));
System.out.println(ArrayAlg.min(12, 22));
ArrayAlg.min(new Test(), new Test());// Error 标红示错
System.out.println(ArrayAlg.max(12, 22));
}
同时extends
左右都允许有多个,如 T, V extends Comparable & Serializable
注意限定类型中,只允许有一个类,而且如果有类,这个类必须是限定列表的第一个。
这种类的限定既可以用在泛型方法上也可以用在泛型类上。
5、泛型中的约束和局限性
现在我们有泛型类
public class Restrict<T> {
// ...
}
5.1 不能用基本类型实例化类型参数
// Java说是万物皆对象,其实不纯粹
//Restrict<double>// double是基本数据类型,不是对象类型
Restrict<Double> restrict = new Restrict<>();// Double是double基本数据类型的包装类,对象类型,在这里才可以用
5.2 运行时类型查询只适用于原始类型
//if(restrict instanceof Restrict<Double>)// 不允许
//if(restrict instanceof Restrict<T>)// 不允许
Restrict<String> restrictString = new Restrict<>();
System.out.println(restrict.getClass() == restrictString.getClass());// true
System.out.println(restrict.getClass().getName());
System.out.println(restrictString.getClass().getName());
5.3 泛型类的静态上下文中类型变量失效
//静态域或者方法里不能引用类型变量
//private static T instance;
//静态方法 本身是泛型方法就行
//private static <T> T getInstance(){}
不能在静态域或方法中引用类型变量。因为泛型是要在对象创建的时候才知道是什么类型的,而对象创建的代码执行先后顺序是static
的部分,然后才是构造函数等等。所以在对象初始化之前static
的部分已经执行了,如果你在静态部分引用的泛型,那么毫无疑问虚拟机根本不知道是什么东西,因为这个时候类还没有初始化。
5.4 不能创建参数化类型的数组
Restrict<Double>[] restrictArray;
//Restrict<Double>[] restricts = new Restrict<Double>[10];// 不允许
5.5 不能实例化类型变量
//不能实例化类型变量
//public Restrict() {
// this.data = new T();
//}
5.6 不能捕获泛型类的实例
/*泛型类不能extends Exception/Throwable*/
//private class Problem<T> extends Exception;
/*不能捕获泛型类对象*/
//public <T extends Throwable> void doWork(T x){
// try{
//
// }catch(T x){
// //do sth;
// }
//}
但是这样可以:
public <T extends Throwable> void doWorkSuccess(T x) throws T{
try{
//...
}catch(Throwable e){
throw x;
}
}
6、泛型类型的继承规则
现在我们有一个类和子类
public class Employee {}
// extends 派生
public class Worker extends Employee {}
有一个泛型类
public class Pair<T> {}
请问Pair<Employee>
和Pair<Worker>
是继承关系吗?
答案:不是,他们之间没有什么关系
Employee employee = new Worker();
//Pair<Employee> employeePair2 = new Pair<Worker>();
但是泛型类可以继承或者扩展其他泛型类,比如List
和ArrayList
Pair<Employee> pair = new ExtendPair<>();
/*泛型类可以继承或者扩展其他泛型类,比如List和ArrayList*/
private static class ExtendPair<T> extends Pair<T>{}
7、通配符类型
正是因为前面所述的,Pair<Employee>
和Pair<Worker>
没有任何关系,如果我们有一个泛型类和一个方法
public static void print(GenericType<Fruit> p){
System.out.println(p.getData().getColor());
}
public class GenericType<T> {}
现在我们有继承关系的类
public class Fruit {}
public class Orange extends Fruit {}
public class Apple extends Fruit {}
public class HongFuShi extends Apple {}
则会产生这种情况:
public static void use(){
GenericType<Fruit> a = new GenericType<>();
print(a);
GenericType<Orange> b = new GenericType<>();
//print(b);
}
为解决这个问题,于是提出了一个通配符类型 ?
有两种使用方式:
? extends X
表示类型的上界,类型参数是X的子类? super X
表示类型的下界,类型参数是X的超类
这两种方式从名字上来看,特别是super
,很有迷惑性,下面我们来仔细辨析这两种方法。
7.1 ? extends X
表示传递给方法的参数,必须是X的子类(包括X本身)
public static void print2(GenericType<? extends Fruit> p){
System.out.println(p.getData().getColor());
}
public static void use2(){
GenericType<Fruit> a = new GenericType<>();
print2(a);
GenericType<Orange> b = new GenericType<>();
print2(b);
//print2(new GenericType<Food>());
GenericType<? extends Fruit> c = b;
// ...
}
但是对泛型类GenericType
来说,如果其中提供了get()
和set()
类型参数变量的方法的话,set()
方法是不允许被调用的,会出现编译错误
public class GenericType<T> {
private T data;
public T getData() {
return data;
}
public void setData(T data) {
this.data = data;
}
}
GenericType<? extends Fruit> c = a;
Apple apple = new Apple();
Fruit fruit = new Fruit();
//c.setData(apple);
//c.setData(fruit);
get()
方法则没问题,会返回一个Fruit
类型的值。
Fruit x = c.getData();
为何?道理很简单,? extends X
表示类型的上界,类型参数是X的子类,那么可以肯定的说,get()
方法返回的一定是个X(不管是X或者X的子类)编译器是可以确定知道的。但是set()
方法只知道传入的是个X,至于具体是X的那个子类,不知道。
总结: 主要用于安全地访问数据,可以访问X及其子类型,并且不能写入非null的数据。
7.2 ? super X
表示传递给方法的参数,必须是X的超类(包括X本身)
public static void printSuper(GenericType<? super Apple> p){
System.out.println(p.getData());
}
public static void useSuper(){
GenericType<Fruit> fruitGenericType = new GenericType<>();
GenericType<Apple> appleGenericType = new GenericType<>();
GenericType<HongFuShi> hongFuShiGenericType = new GenericType<>();
GenericType<Orange> orangeGenericType = new GenericType<>();
printSuper(fruitGenericType);
printSuper(appleGenericType);
//printSuper(hongFuShiGenericType);
//printSuper(orangeGenericType);
但是对泛型类GenericType
来说,如果其中提供了get()
和set()
类型参数变量的方法的话,set()
方法可以被调用的,且能传入的参数只能是X或者X的子类
public class GenericType<T> {
private T data;
public T getData() {
return data;
}
public void setData(T data) {
this.data = data;
}
}
//不允许
//x.setData(new Fruit());
x.setData(new Apple());
x.setData(new HongFuShi());
Object data = x.getData();// 唯一可行的赋值
get()
方法只会返回一个Object
类型的值。
Fruit y = x.getData();// 唯一可行的赋值
为何?? super X
表示类型的下界,类型参数是X的超类(包括X本身),那么可以肯定的说,get()
方法返回的一定是个X的超类,那么到底是哪个超类?不知道,但是可以肯定的说,Object
一定是它的超类,所以get()
方法返回Object
。编译器是可以确定知道的。对于set()
方法来说,编译器不知道它需要的确切类型,但是X和X的子类可以安全的转型为X。
总结: 主要用于安全地写入数据,可以写入X及其子类型。
7.3 无限定的通配符?
表示对类型没有什么限制,可以把?
看成所有类型的父类,如Pair< ?>
,比如:
ArrayList<T> al=new ArrayList<T>();
指定集合元素只能是T
类型
ArrayList<?> al=new ArrayList<?>();
集合元素可以是任意类型,这种没有意义,一般是方法中,只是为了说明用法。
在使用上:
? getFirst()
: 返回值只能赋给 Object
;
void setFirst(?)
: setFirst
方法不能被调用, 甚至不能用 Object
调用;
8、虚拟机是如何实现泛型的?
泛型思想早在C++语言的模板(Template)中就开始生根发芽,在Java语言处于还没有出现泛型的版本时,只能通过Object
是所有类型的父类和类型强制转换两个特点的配合来实现类型泛化。由于Java语言里面所有的类型都继承于java.lang.Object
,所以Object
转型成任何对象都是有可能的。但是也因为有无限的可能性,就只有程序员和运行期的虚拟机才知道这个Object
到底是个什么类型的对象。在编译期间,编译器无法检查这个Object
的强制转型是否成功,如果仅仅依赖程序员去保障这项操作的正确性,许多ClassCastException
的风险就会转嫁到程序运行期之中。
泛型技术在C#和Java之中的使用方式看似相同,但实现上却有着根本性的分歧,C#里面泛型无论在程序源码中、编译后的IL中(Intermediate Language,中间语言,这时候泛型是一个占位符),或是运行期的CLR中,都是切实存在的,List<int>
与List<String>
就是两个不同的类型,它们在系统运行期生成,有自己的虚方法表和类型数据,这种实现称为类型膨胀,基于这种方法实现的泛型称为真实泛型。
Java语言中的泛型则不一样,它只在程序源码中存在,在编译后的字节码文件中,就已经替换为原来的原生类型(Raw Type,也称为裸类型)了,并且在相应的地方插入了强制转型代码,因此,对于运行期的Java语言来说,ArrayList<int>
与ArrayList<String>
就是同一个类,所以泛型技术实际上是Java语言的一颗语法糖,Java语言中的泛型实现方法称为类型擦除,基于这种方法实现的泛型称为伪泛型。
虚拟机为什么设计泛型擦除?
早期Java(1.5之前)实现没有泛型的概念,后根据使用场景添加了泛型功能,为了向前兼容1.5之前代码,采用了泛型擦除,强制转换为Object。
将一段Java代码编译成Class
文件,然后再用字节码反编译工具进行反编译后,将会发现泛型都不见了,程序又变回了Java泛型出现之前的写法,泛型类型都变回了原生类型
public static String method(List<String> stringList){
System.out.println("List");
return "OK";
}
//public static Integer method(List<Integer> stringList){
// System.out.println("List");
// return 1;
//}
上面这段代码是不能被编译的,因为参数List<Integer>
和List<String>
编译之后都被擦除了,变成了一样的原生类型List<E>
,擦除动作导致这两种方法的特征签名变得一模一样。
由于Java泛型的引入,各种场景(虚拟机解析、反射等)下的方法调用都可能对原有的基础产生影响和新的需求,如在泛型类中如何获取传入的参数化类型等。因此,JCP组织对虚拟机规范做出了相应的修改,引入了诸如Signature
、LocalVariableTypeTable
等新的属性用于解决伴随泛型而来的参数类型的识别问题,Signature
是其中最重要的一项属性,它的作用就是存储一个方法在字节码层面的特征签名,这个属性中保存的参数类型并不是原生类型,而是包括了参数化类型的信息。修改后的虚拟机规范要求所有能识别49.0以上版本的Class
文件的虚拟机都要能正确地识别Signature
参数。
另外,从Signature
属性的出现我们还可以得出结论,擦除法所谓的擦除,仅仅是对方法的Code属性中的字节码进行擦除,实际上元数据中还是保留了泛型信息,这也是我们能通过反射手段取得参数化类型的根本依据。