条款七:为多态基类声明virtual析构函数
有很多种做法可以记录时间,因此,设计一个TimeKeeper base class和一些derived classes作为不同的计时方法,相当合情合理:
class TimeKeeper
{
public:
TimeKeeper() ;
~TimeKepper() ;
...
} ;
class AtomicClock:public TimeKeeper{...}// 原子钟
class WaterClock:public TimeKeeper{...}// 水钟
class WristWatch:public TimeKeeper{...}// 腕表
许多客户只想在程序中使用时间,不想操心时间如何计算等细节,这时候我们可以设计factory(工程)函数,返回指针只想一个计时对象。Factory函数会“返回一个base class指针,只想新生成之derived class对象”:
TimeKeeper* getTimeKeeper() ;// 返回一个指针,指向一个TimeKeeper派生类的动态分配对象
为了遵守factory函数的规矩,被getTimeKeeper()返回的对象必须位于heap。因此为了避免泄露内存和其他资源,将factory函数返回的每一个对象适当地delete掉很总要:
TimeKeeper* ptk = getTimeKeeper();// 从TimeKeeper继承体系获得一个动态内存分配对象。
...// 运用它
delete ptk ;// 释放它,避免资源泄露。
条款13说“依赖客户执行delete动作,基本上便带有某种错误倾向”,条款18谈到factory函数接口该如何修改以便预防常见之客户错误,但这些在此都是次要的,因为此条款捏我们要对付的是上述代码的一个根本弱点:总是可是把每一件事都做对了,任然没有办法知道程序如何行动。
为题出在getTimeKeeper返回的指针指向一个derived class对象(例如AtomicClock),而那个对象却经由一个base class指针(例如一个TimeKeeper*指针)被删除,而目前的base class(TimeKeeper)有个non-virtual析构函数。这是一个引来灾难的秘诀,因为C++明白指出,当derived class对象经由一个base class指针被删除,而该base class带着一个non-vrtual析构函数,其结果未有定义---实际执行时通常发生的是对象的derived成分没被销毁。如果getTimeKeeper返回指针指向一个AtomicClock,其内的AtomicClock成分(也就是声明于AtomicClock class内的成员变量)很可能没被销毁,而AtomicClock的析构函数也未能执行起来。然而其base class成分(也即是TimeKeeper这一部分)通常会被销毁,于是造成一个诡异的“局部销毁”对象。这可是形成资源泄露、败坏之数据结构、在调试器上浪费许多时间的绝佳途径喔。
消除这个问题的做法很简单:给base class一个virtual析构函数。伺候删除derived class对象就会如你想要的那般。是的,它会销毁整个对象,包括所有derived class成分:
class Timekeeper
{
public:
TimeKeeper() ;
virtual ~TimeKeeper() ;
...
} ;
TimeKeeper* ptk = getTimeKeeper() ;
...
delete ptk ;// 现在,行为正确
想Timekeeper这样的base class除了析构函数之外通常还有其他virtual函数,因为virtual函数的目的是允许derived class的实现得以客制化。例如TimeKeeper就可能拥有一个virtual getCurrentTime,它在不同的derived classes中有不同的实现代码。任何class只要带有virtual函数都几乎确定应该也有个virtual析构函数。
如果class不含virtual函数,通常表示它并不意图被用做一个base class。当class不企图被当做base class,令其析构函数为virtual往往是个馊主意。考虑一个用来表示二维空间的点坐标的class:
class Point
{
public:
Point(int xCoord, int yCoord) ;
~Point() ;
private:
int x, y ;
} ;
如果int占用32bits,那么Point对象可塞入一个64bit缓冲器中。更有甚者,这样一个Point对象可被当做一个“64-bit量”传给以其他语言如C或FORTRAN撰写的函数。然而当Point的析构函数是virtual,形式起了变化。
欲实现出virtual函数,对象必须携带某些信息,主要用来在运行期决定哪一个virtual函数该被调用。这份信息通常是由一个vptr(virtual table pointer)智者指出。vptr指向一个由函数指针构成的数组,称为vtbl(virtual table);每一个带有virtual函数的class都有一个相应的vtbl。当对象调用某一个virtual函数,实际被调用的函数取决于该对象的vptr所指的那个vtbl---编译器在其中寻找适当地函数指针。
virtual函数的实现细节不重要。中要的是如果Point class内含virtual函数,其对象的体积会增加:在32-bit计算机体系结构中将占用64bits(为了存放两个ints)至96bits(两个ints加上vptr);在64-bit计算机体系结构中可能占用64~128bits,因为指针在这样的计算机结构中占用64bits。因此,为Point添加一个vptr会增加其对象大小达50%~100%!Point对象不再能够塞进一个64-bit缓存器,而C++的Pint对象也不再和其他语言(如C)内的相同声明有着一样的结构(因为其他语言的对应物并没有vptr),因此也就不再可能把它传递至(或接受自)其他语言所写的函数,除非你明确补偿vptr---那属于实现细节,也因此不再具有移植性。
因此,无端地将所有的classes的析构函数声明为virtual,就像从未声明它们为virtual一样,都是错误的。许多人的心得是:只有当class内含至少一个virtual函数,才为它声明virtual析构函数。
即使class完全不带virtual函数,被“non-virtual析构函数问题”给咬伤还是有可能的。举个例子,标准string不含任何virtual函数,但有时程序员会错误地把它当做base class:
class SpecialString:public std::string// 馊主意,std::string有个 non-virtual析构函数
{
...
}
咋看似乎无害,但如果你在程序任意某处无意间将一个pointer-to-SpecialString转换为一个pointer-to-string,然后将转换所得的那个string指针delete掉,你like被流放到'行为不明确“的恶地上:
SpecialString pss = new SpeicalString("Impending Doom") ;
std::string* ps ;
...
ps = pss ;// SpecialString* =>std::string*
...
delete ps ;// 未有定义!实现中*ps的SpecialString资源会被泄露,因为SpecialString析构函数没被调用。
相同的分析使用于任何不带virtual析构函数的class,包括所有STL容器如vector,list,set,tr1::unordered_map等等。如果你曾经企图继承一个标准容器或其他“带有non-virtual析构函数”的class,拒绝诱惑吧!(很不幸C++没有提供类似Java的final classes或C#的sealed classes那样的“禁止派生”机制。)
有时候令class带一个pure virtual胸骨函数,可能颇为便利。还记得吗,pure virtual函数导致abstract(抽象)classes---也即是不能被实体化(instantiated)的class。也就是说,你不能为那种类型创建对象。然而有时候你希望拥有抽象class,但手上没有任何pure virtual函数,怎么办?唔,由于抽象class总是企图被当做一个base class来用,而又由于base class应该有个virtual析构函数,并且由于pure virtual函数会导致抽象class,因此解法很简单:为你希望它成为抽象的那个class声明一个pure virtual析构函数。下面是个例子:
class AWOV// AWOV = "Abstract w/o Virtuals"
{
public:
virtual ~AWOV() = 0 ;// 声明pure virtual析构函数
} ;
这个class有一个pure virtual函数,所以它是个抽象class,又由于它有个virtual 析构函数,所以你不需要担心析构函数的问题。人儿这里有个窍门:你必须为这个pure virtual析构函数提供一份定义:
AWOV::~AWOV(){}// pure virtual析构函数的定义
析构函数的运作方式是,最深层派生的那个class其析构函数最先被调用,然后是其每一个base class的析构函数被调用。编译器会在AWOV的derived class的析构函数中创建一个对~AWOV的调用动作,所以你必须为这个函数提供一份定义。如果不这样做,连接器会发出抱怨。
“给base class一个virtual析构函数”,这个规则之使用于polymorphic(带多态性质的)base class身上。这种base classes。这种base classes的设计目的是为了用来“通过base class接口处理derived class对象”。TimeKeeper就是一个polymorphic base class,因为我们希望处理AtomicClock和WaterClock对象,总是我们只有TimeKeeper指针指向他们。
并非所有的base class的设计目的都是为了多态用途。例如标准string和STL容器都不被设计作为base classes使用,更别提多态了。某些classes的设计目的是作为base classes使用,但不是为了多了多态用途。这样的classes如条款6的Uncopyable和标准程序库的input_iteratro_tag(条款47),它们并非被设计用来“经由base class接口处理derived class对象”因此它们不需要virtual析构函数。
请记住:
* polymorphic(带多态性质的)base classes应该声明一个virtual析构函数。如果class带有任何virtual函数,它就应该拥有一个virtual析构函数。
* Class的设计目的如果不是作为base classes使用,或不是为了具备多态性(polymoriphically),就不应该声明virtual析构函数。