C++多态
多态的概念
多态就是函数调用的多种形态,使用多态能够使得不同的对象去完成同一件事时,产生不同的结果。例如,在现实生活当中,普通人买票是全价,学生买票是半价,而军人允许优先买票。
多态的定义及实现
多态的构成条件
多态是在不同继承关系的类对象,去调用同一函数,产生了不同的行为。在继承中要想构成多态需要满足两个条件:
1.必须通过基类的指针或者引用调用虚函数。
2.被调用的函数必须是虚函数,且派生类必须对基类的虚函数进行重写。
虚函数
被virtual修饰的类成员函数被称为虚函数。
需要注意的是:
1.只有类的非静态成员函数前可以加virtual,普通函数前不能加virtual。
2.虚函数这里的virtual和虚继承中的virtual是同一个关键字,但是它们之间没有任何关系。虚函数这里的virtual是为了实现多态,而虚继承的virtual是为了解决菱形继承的数据冗余和二义性。
虚函数的重写
虚函数的重写也叫做虚函数的覆盖,虚函数的重写要三同原则,满足若派生类中有一个和基类完全相同的虚函数(返回值类型相同、函数名相同以及参数列表完全相同),此时我们称该派生类的虚函数重写了基类的虚函数。
注意:在重写基类虚函数时,派生类的虚函数在不加virtual关键字时,虽然也可以构成重写(因为继承后基类的虚函数被继承下来了在派生类依旧保持虚函数属性),但是该种写法不是很规范,不建议这样使用。
虚函数重写的两个例外
1.协变(基类与派生类虚函数的返回值类型不同)
派生类重写基类虚函数时,与基类虚函数返回值类型不同。即基类虚函数返回基类对象的指针或者引用,派生类虚函数返回派生类对象的指针或者引用,称为协变。
//基类
class A
{};
//子类
class B : public A
{};
//基类
class Person
{
public:
//返回基类A的指针
virtual A* fun()
{
cout << "A* Person::f()" << endl;
return new A;
}
};
//子类
class Student : public Person
{
public:
//返回子类B的指针
virtual B* fun()
{
cout << "B* Student::f()" << endl;
return new B;
}
};
2.析构函数的重写
如果基类的析构函数为虚函数,此时派生类析构函数只要定义,无论是否加virtual关键字,都与基类的析构函数构成重写,虽然基类与派生类析构函数名字不同。虽然函数名不相同,看起来违背了重写的规则,其实不然,这里可以理解为编译器对析构函数的名称做了特殊处理,编译后析构函数的名称统一处理成destructor。
那父类和子类的析构函数构成重写的意义何在呢?试想以下场景:分别new一个父类对象和子类对象,并均用父类指针指向它们,然后分别用delete调用析构函数并释放对象空间。
//父类
class Person
{
public:
virtual ~Person()
{
cout << "~Person()" << endl;
}
};
//子类
class Student : public Person
{
public:
virtual ~Student()
{
cout << "~Student()" << endl;
}
};
nt main()
{
//分别new一个父类对象和子类对象,并均用父类指针指向它们
Person* p1 = new Person;
Person* p2 = new Student;
//使用delete调用析构函数并释放对象空间
delete p1;
delete p2;//调用Student对象的析构函数,先析构子类,在析构父类
return 0;
}
在这种场景下,若是父类和子类的析构函数没有构成重写就可能会导致内存泄漏,因为此时delete p1和delete p2都是调用的父类的析构函数,而我们所期望的是p1调用父类的析构函数,p2调用子类的析构函数,即我们期望的是一种多态行为。
此时只有父类和子类的析构函数构成了重写,才能使得delete按照我们的预期进行析构函数的调用,才能实现多态。因此,为了避免出现这种情况,比较建议将父类的析构函数定义为虚函数。
C++11 override和final
从上面可以看出,C++对函数重写的要求比较严格,有些情况下由于疏忽可能会导致函数名的字母次序写反而无法构成重写,而这种错误在编译期间是不会报错的,直到在程序运行时没有得到预期结果再来进行调试会得不偿失,因此,C++11提供了final和override两个关键字,可以帮助用户检测是否重写。
final:修饰虚函数,表示该虚函数不能再被重写。
override:检查派生类虚函数是否重写了基类的某个虚函数,如果没有重写则编译报错。
重载、覆盖(重写)、隐藏(重定义)的对比
抽象类
概念
在虚函数的后面写上=0,则这个函数为纯虚函数。包含纯虚函数的类叫做抽象类(也叫接口类),抽象类不能实例化出对象。
//抽象类(接口类)
class Car
{
public:
//纯虚函数
virtual void Drive() = 0;
};
int main()
{
Car c; //抽象类不能实例化出对象,error
return 0;
}
派生类继承抽象类后也不能实例化出对象,只有重写纯虚函数,派生类才能实例化出对象。
抽象类既然不能实例化出对象,那抽象类存在的意义是什么?
1.抽象类可以更好的去表示现实世界中,没有实例对象对应的抽象类型,比如:植物、人、动物等。
2.抽象类很好的体现了虚函数的继承是一种接口继承,强制子类去重写纯虚函数,因为子类若是不重写从父类继承下来的纯虚函数,那么子类也是抽象类也不能实例化出对象。
接口继承和实现继承
实现继承: 普通函数的继承是一种实现继承,派生类继承了基类函数的实现,可以使用该函数。
接口继承: 虚函数的继承是一种接口继承,派生类继承的是基类虚函数的接口,目的是为了重写,达成多态。
所以如果不实现多态,就不要把函数定义成虚函数。
多态的原理
虚函数表
下面是一道常考的笔试题:Base类实例化出对象的大小是多少?
class Base
{
public:
virtual void Func1()
{
cout << "Func1()" << endl;
}
private:
int _b = 1;
};
int main()
{
Base b;
cout << sizeof(b) << endl; //8(32) 16 (64)
return 0;
}
通过观察测试,在32位平台下,Base类实例化的对象b的大小是8,在64位平台下,Base类实例化的对象b的大小是16,因为64位平台下,指针的大小是8字节,所以8 + 4 + 内存对齐的4字节 = 16。
b对象当中除了_b成员外,实际上还有一个_vfptr放在对象的前面(有些平台可能会放到对象的最后面,这个跟平台有关)。
对象中的这个指针叫做虚函数表指针,简称虚表指针,虚表指针指向一个虚函数表,简称虚表,每一个含有虚函数的类中都至少有一个虚表指针。
虚函数表中到底放的是什么?
下面Base类当中有三个成员函数,其中Func1和Func2是虚函数,Func3是普通成员函数,子类Derive当中仅对父类的Func1函数进行了重写。
//父类
class Base
{
public:
//虚函数
virtual void Func1()
{
cout << "Base::Func1()" << endl;
}
//虚函数
virtual void Func2()
{
cout << "Base::Func2()" << endl;
}
//普通成员函数
void Func3()
{
cout << "Base::Func3()" << endl;
}
private:
int _b = 1;
};
//子类
class Derive : public Base
{
public:
//重写虚函数Func1
virtual void Func1()
{
cout << "Derive::Func1()" << endl;
}
private:
int _d = 2;
};
int main()
{
Base b;
Derive d;
return 0;
}
实际上虚表当中存储的就是虚函数的地址,因为基类当中的Func1和Func2都是虚函数,所以基类对象b的虚表当中存储的就是虚函数Func1和Func2的地址。
基类b对象和派生类d对象虚表是不一样的,这里我们发现Func1完成了重写,所以d的虚表
中存的是重写的Derive::Func1,所以虚函数的重写也叫作覆盖,覆盖就是指虚表中虚函数
的覆盖。重写是语法的叫法,覆盖是原理层的叫法。
此外,虚函数表本质是一个存虚函数指针的指针数组,一般情况下会在这个数组最后放一个nullptr。
总结一下,派生类的虚表生成步骤如下:
1.先将基类中的虚表内容拷贝一份到派生类的虚表。
2.如果派生类重写了基类中的某个虚函数,则用派生类自己的虚函数地址覆盖虚表中基类的虚函数地址。
3.派生类自己新增加的虚函数按其在派生类中的声明次序增加到派生类虚表的最后。
虚表是什么阶段初始化的?虚函数存在哪里?虚表存在哪里?
虚表实际上是在构造函数初始化列表阶段进行初始化的,注意虚表当中存的是虚函数的地址不是虚函数,虚函数和普通函数一样,都是存在代码段的,只是他的地址又存到了虚表当中。另外,对象中存的不是虚表而是指向虚表的指针。
至于虚表是存在哪里的,我们可以通过以下这段代码进行判断。
int j = 0;
int main()
{
Base b;
Base* p = &b;
printf("vfptr:%p\n", *((int*)p)); //000FDCAC
int i = 0;
printf("栈上地址:%p\n", &i); //005CFE24
printf("数据段地址:%p\n", &j); //0010038C
int* k = new int;
printf("堆上地址:%p\n", k); //00A6CA00
char* cp = "hello world";
printf("代码段地址:%p\n", cp); //000FDCB4
return 0;
}
代码当中打印了对象b头四个字节的地址,也就是虚表的地址,可以发现虚表的地址比代码段的地址还要小,由此我们可以得出虚表实际上是存在代码段的。
多态的原理
例如,下面代码中,为什么当父类Person指针指向的是父类对象Mike时,调用的就是父类的BuyTicket,当父类Person指针指向的是子类对象Johnson时,调用的就是子类的BuyTicket?
//父类
class Person
{
public:
virtual void BuyTicket()
{
cout << "买票-全价" << endl;
}
int _p = 1;
};
//子类
class Student : public Person
{
public:
virtual void BuyTicket()
{
cout << "买票-半价" << endl;
}
int _s = 2;
};
int main()
{
Person Mike;
Student Johnson;
Johnson._p = 3; //以便观察是否完成切片
Person* p1 = &Mike;
Person* p2 = &Johnson;
p1->BuyTicket(); //买票-全价
p2->BuyTicket(); //买票-半价
return 0;
}
通过调试可以发现,对象Mike中包含一个成员变量_p和一个虚表指针,对象Johnson中包含两个成员变量_p和_s以及一个虚表指针,这两个对象当中的虚表指针分别指向自己的虚表。
围绕此图分析便可得到多态的原理:
1.父类指针p1指向Mike对象,p1->BuyTicket在Mike的虚表中找到的虚函数就是Person::BuyTicket。
2.父类指针p2指向Johnson对象,p2>BuyTicket在Johnson的虚表中找到的虚函数就是Student::BuyTicket。
这样就实现出了不同对象去完成同一行为时,展现出不同的形态。
现在想想多态构成的两个条件,一是完成虚函数的重写,二是必须使用父类的指针或者引用去调用虚函数。必须完成虚函数的重写是因为我们需要完成子类虚表当中虚函数地址的覆盖,那为什么必须使用父类的指针或者引用去调用虚函数呢?为什么使用父类对象去调用虚函数达不到多态的效果呢?
Person* p1 = &Mike;
Person* p2 = &Johnson;
使用父类指针或者引用时,实际上是一种切片行为,切片时只会让父类指针或者引用得到父类对象或子类对象中切出来的那一部分。
因此,我们后序用p1和p2调用虚函数时,p1和p2通过虚表指针找到的虚表是不一样的,最终调用的函数也是不一样的。
使用父类对象时,切片得到部分成员变量后,会调用父类的拷贝构造函数对那部分成员变量进行拷贝构造,而拷贝构造出来的父类对象p1和p2当中的虚表指针指向的都是父类对象的虚表。因为同类型的对象共享一张虚表,他们的虚表指针指向的虚表是一样的。
Person p1 = Mike;
Person p2 = Johnson;
因此,我们后序用p1和p2调用虚函数时,p1和p2通过虚表指针找到的虚表是一样的,最终调用的函数也是一样的,也就无法构成多态
总结:
1.构成多态,指向谁就调用谁的虚函数,跟对象有关。
2.不构成多态,对象类型是什么就调用谁的虚函数,跟类型有关。
动态绑定和静态绑定
静态绑定: 静态绑定又称为前期绑定(早绑定),在程序编译期间确定了程序的行为,也成为静态多态,比如:函数重载。
动态绑定: 动态绑定又称为后期绑定(晚绑定),在程序运行期间,根据具体拿到的类型确定程序的具体行为,调用具体的函数,也称为动态多态。
我们可以通过查看汇编的方式进一步理解静态绑定和动态绑定。
//父类
class Person
{
public:
virtual void BuyTicket()
{
cout << "买票-全价" << endl;
}
};
//子类
class Student : public Person
{
public:
virtual void BuyTicket()
{
cout << "买票-半价" << endl;
}
};
我们若是按照如下方式调用BuyTicket函数,则不构成多态,函数的调用是在编译时确定的。
int main()
{
Student Johnson;
Person p = Johnson; //不构成多态
p.BuyTicket();
return 0;
}
将调用函数的那句代码翻译成汇编就只有以下两条汇编指令,也就是直接调用的函数,这是在编译时期就拿到了函数的地址的。
而我们若是按照如下方式调用BuyTicket函数,则构成多态,函数的调用是在运行时确定的。
int main()
{
Student Johnson;
Person& p = Johnson; //构成多态
p.BuyTicket();
return 0;
}
相比不构成多态时的代码,构成多态时调用函数的那句代码翻译成汇编后就变成了八条汇编指令,主要原因就是我们需要在运行时,先到指定对象的虚表中找到要调用的虚函数,然后才能进行函数的调用。
call eax 才是调用虚函数。
单继承和多继承关系的虚函数表
单继承中的虚函数表
以下列单继承关系为例,我们来看看基类和派生类的虚表模型。
//基类
class Base
{
public:
virtual void func1() { cout << "Base::func1()" << endl; }
virtual void func2() { cout << "Base::func2()" << endl; }
private:
int _a;
};
//派生类
class Derive : public Base
{
public:
virtual void func1() { cout << "Derive::func1()" << endl; }
virtual void func3() { cout << "Derive::func3()" << endl; }
virtual void func4() { cout << "Derive::func4()" << endl; }
private:
int _b;
};
其中,基类和派生类对象的虚表模型如下:
在单继承关系当中,派生类的虚表生成过程如下:
1.继承基类的虚表内容到派生类的虚表。
2.对派生类重写了的虚函数地址进行覆盖,比如func1。
3.虚表当中新增派生类当中新的虚函数地址,比如func3和func4。
在调试过程中,某些编译器的监视窗口当中看不到虚表当中的func3和func4,可能是编译器的监视窗口故意隐藏了这两个函数,也可以认为这是一个小bug,此时如果我们想要看到派生类对象完整的虚表可以用代码打印出来。
使用代码打印虚表内容
typedef void(*VFPTR)(); //虚函数指针类型重命名
//打印虚表地址及其内容
void PrintVFT(VFPTR* ptr)
{
printf("虚表地址:%p\n", ptr);
for (int i = 0; ptr[i] != nullptr; i++)
{
printf("ptr[%d]:%p-->", i, ptr[i]); //打印虚表当中的虚函数地址
ptr[i](); //使用虚函数地址调用虚函数
}
printf("\n");
}
int main()
{
// 1.先取b的地址,强转成一个int*的指针
// 2.再解引用取值,就取到了b对象头4bytes的值,这个值就是指向虚表的指针
// 3.再强转成VFPTR*,因为虚表就是一个存VFPTR类型(虚函数指针类型)的数组。
// 4.虚表指针传递给PrintVTable进行打印虚表
Base b;
PrintVFT((VFPTR*)(*(int*)&b)); //打印基类对象b的虚表地址及其内容
Derive d;
PrintVFT((VFPTR*)(*(int*)&d)); //打印派生类对象d的虚表地址及其内容
return 0;
}
多继承中的虚函数表
以下列多继承关系为例,我们来看看基类和派生类的虚表模型。
//基类1
class Base1
{
public:
virtual void func1() { cout << "Base1::func1()" << endl; }
virtual void func2() { cout << "Base1::func2()" << endl; }
private:
int _b1;
};
//基类2
class Base2
{
public:
virtual void func1() { cout << "Base2::func1()" << endl; }
virtual void func2() { cout << "Base2::func2()" << endl; }
private:
int _b2;
};
//多继承派生类
class Derive : public Base1, public Base2
{
public:
virtual void func1() { cout << "Derive::func1()" << endl; }
virtual void func3() { cout << "Derive::func3()" << endl; }
private:
int _d1;
};
其中,两个基类的虚表模型如下:
而派生类的虚表模型就不那么简单了,派生类的虚表模型如下:
在多继承关系当中,派生类的虚表生成过程如下:
1.分别继承各个基类的虚表内容到派生类的各个虚表当中。
2.对派生类重写了的虚函数地址进行覆盖(派生类中的各个虚表中存有该被重写虚函数地址的都需要进行覆盖),比如func1。
3.在派生类第一个继承基类部分的虚表当中新增派生类当中新的虚函数地址,比如func3。
使用代码打印虚表内容
typedef void(*VFPTR)(); //虚函数指针类型重命名
//打印虚表地址及其内容
void PrintVFT(VFPTR* ptr)
{
printf("虚表地址:%p\n", ptr);
for (int i = 0; ptr[i] != nullptr; i++)
{
printf("ptr[%d]:%p-->", i, ptr[i]); //打印虚表当中的虚函数地址
ptr[i](); //使用虚函数地址调用虚函数
}
printf("\n");
}
int main()
{
Base1 b1;
Base2 b2;
PrintVFT((VFPTR*)(*(int*)&b1)); //打印基类对象b1的虚表地址及其内容
PrintVFT((VFPTR*)(*(int*)&b2)); //打印基类对象b2的虚表地址及其内容
Derive d;
PrintVFT((VFPTR*)(*(int*)&d)); //打印派生类对象d的第一个虚表地址及其内容
PrintVFT((VFPTR*)(*(int*)((char*)&d + sizeof(Base1)))); //打印派生类对象d的第二个虚表地址及其内容
return 0;
}
多态常见面试题
1、什么是多态?
多态是指不同继承关系的类对象,去调用同一函数,产生了不同的行为。多态又分为静态的多态和动态的多态。
2、什么是重载、重写(覆盖)、重定义(隐藏)?
重载是指两个函数在同一作用域,这两个函数的函数名相同,参数不同。
重写(覆盖)是指两个函数分别在基类和派生类的作用域,这两个函数的函数名、参数、返回值都必须相同(协变例外),且这两个函数都是虚函数。
重定义(隐藏)是指两个函数分别在基类和派生类的作用域,这两个函数的函数名相同。若两个基类和派生类的同名函数不构成重写就是重定义。
3、多态的实现原理?
构成多态的父类对象和子类对象的成员当中都包含一个虚表指针,这个虚表指针指向一个虚表,虚表当中存储的是该类对应的虚函数地址。因此,当父类指针指向父类对象时,通过父类指针找到虚表指针,然后在虚表当中找到的就是父类当中对应的虚函数地址;当父类指针指向子类对象时,通过父类指针找到虚表指针,然后在虚表当中找到的就是子类当中对应的虚函数地址。
4、inline函数可以是虚函数吗?
我们知道内联函数是会在调用的地方展开的,也就是说内联函数是没有地址的,但是内联函数是可以定义成虚函数的,当我们把内联函数定义虚函数后,编译器就忽略了该函数的内联属性,这个函数就不再是内联函数了,因为需要将虚函数的地址放到虚表中去。
5、静态成员函数可以是虚函数吗?
静态成员函数不能是虚函数,因为静态成员函数没有this指针,使用类型::成员函数的调用方式无法访问虚表,所以静态成员函数无法放进虚表。
6、构造函数可以是虚函数吗?
构造函数不能是虚函数,因为虚函数表是在构造函数初始化列表阶段才初始化的。
7、析构函数可以是虚函数吗?什么场景下析构函数是虚函数?
析构函数可以是虚函数,并且最后把基类的析构函数定义成虚函数。若是我们分别new一个父类对象和一个子类对象,并均用父类指针指向它们,当我们使用delete调用析构函数并释放对象空间时,只有当父类的析构函数是虚函数的情况下,才能正确调用父类和子类的析构函数分别对父类和子类对象进行析构,否则当我们使用父类指针delete对象时,只能调用到父类的析构函数。
8、对象访问普通函数快还是虚函数更快?
对象访问普通函数比访问虚函数更快,若我们访问的是一个普通函数,那直接访问就行了,但当我们访问的是虚函数时,我们需要先找到虚表指针,然后在虚表当中找到对应的虚函数地址,最后才能调用到虚函数。
9、虚函数表是在什么阶段生成的?存在哪的?
虚表是在构造函数初始化列表阶段进行初始化的,虚表一般情况下是存在代码段(常量区)的。
10、C++菱形继承的问题?虚继承的原理?
菱形虚拟继承因为子类对象当中会有两份父类的成员,因此会导致数据冗余和二义性的问题。
虚继承对于相同的虚基类在对象当中只会存储一份,若要访问虚基类的成员需要通过虚基表获取到偏移量,进而找到对应的虚基类成员,从而解决了数据冗余和二义性的问题。