七、C++函数的高级特性
综述:对比于C语言的函数,C++增加了重载(overloaded)、内联(inline)、const和virtual四种新机制。其中重载和内联机制既可用于全局函数也可用于类的成员函数,const与virtual机制仅用于类的成员函数。重载和内联肯定有其好处才会被C++语言采纳,但是不可以当成免费的午餐而滥用。
我的理解:不要为了炫耀技术的高深而盲目使用C++函数高级特性,如果C++的基本语法能实现需要的功能就不要用复杂的语法来实现。正如某们牛人说的那样:用C设计,用C++编码
1、 使用重载的原因
① 在C++程序中,可以将语义、功能相似的几个函数用同一个名字表示,即函数重载。这样便于记忆,提高了函数的易用性,这是C++语言采用重载机制的一个理由。
② C++语言采用重载机制的另一个理由是:类的构造函数需要重载机制。因为C++规定构造函数与类同名(请参见第9章),构造函数只能有一个名字。如果想用几种不同的方法创建对象该怎么办?别无选择,只能用重载机制来实现。所以类可以有多个同名的构造函数。
构造函数各类:普通构造函数、拷贝构造函数
2009-4-1
2、 重载、覆盖、隐藏
① 成员函数被重载的特征:
(1)相同的范围(在同一个类中);
(2)函数名字相同;
(3)参数不同;
(4)virtual关键字可有可无。
② 覆盖是指派生类函数覆盖基类函数,特征是:
(1)不同的范围(分别位于派生类与基类);
(2)函数名字相同;
(3)参数相同;
(4)基类函数必须有virtual关键字。
我的理解:(1)只有virtual才会产生虚表,才有vptr和vtable,这就是C++的多态性。
(2)派生类先调用基类的构造函数再调用自己的构造函数,构造函数不能虚拟化。
(3)派生类先调用自己的析构函数再调用基类的析构函数,析构函数可虚拟化,这样做目的是为了对象指针类型转换后析构的时候调用正确的析构函数,避免析构错误对象。如下例,如析构函数未虚拟化,为了析构A类,在执行delete的时候却先把B析构了。
举例:
Base class A
Derived class B
执行操作:A* pA = new A;
B* pB = (B*)pA;
delete pB;
a) 当析构函数都未虚拟化,执行的顺序是A构造->B析构->A析构
b) 当基类析构函数虚拟化,执行顺序是A构造->A析构
c) 当子类析构函数虚拟化,执行顺序是A构造->出错(原因分析在下面)
③ “隐藏”是指派生类的函数屏蔽了与其同名的基类函数,规则如下:
(1)如果派生类的函数与基类的函数同名,但是参数不同。此时,不论有无virtual关键字,基类的函数将被隐藏(注意别与重载混淆)。
(2)如果派生类的函数与基类的函数同名,并且参数也相同,但是基类函数没有virtual关键字。此时,基类的函数被隐藏(注意别与覆盖混淆)。
我的理解:解释及所举例子并不是很清楚。其实只要正确理解了对象内存布局及虚表的含义就容易处理了。
对象的内存布局:先是vptr(如果有),然后是成员变量(静态成员变量放在全局数据区),非虚函数地址是不存放在对象空间的,编译时在代码段生成函数调用代码(形如call A::func,offset是确定的);而虚函数则是在运行的时候加载到内存空间(offset是固定的,只需要重定位),然后再生成vptr、vtable(将重定位的虚函数地址填入vtable),这样才能保证多态性调用正确的函数。每一个对象在内存中有唯一的一份vtable,子类的vtable还保存有父类的虚函数地址(先排列子类的,再排列父类的,如果是多重继承,则按先后顺序排列)。
上面第三种情况出错分析:基类的内存布局没有vptr,在子类指针指向基类内存布局后,因为其为虚析构函数,会按照取得vptr、查找vtable获得的析构函数地址的方式执行,这时取得的函数地址是一个错误的地址。
引申:关于原文中的8.2.2(b)所举例子的两个surprise,其实原理很简单,因为两个函数g()、h()因为不是虚函数,所以在编译的时候已经生成了调用代码,根据调用代码处的EIP再加上offset寻址相应的函数。
3、 函数的缺省值
① 参数缺省值只能出现在函数的声明中,而不能出现在函数的实现中
② 如果函数有多个参数,参数只能从后向前挨个儿缺省
③ 不合理地使用参数的缺省值将导致重载函数output产生二义性,如下例:
void output( int x);
void output( int x, float y=0.0);
4、 运算符重载
① 如果运算符被重载为全局函数,那么只有一个参数的运算符叫做一元运算符,有两个参数的运算符叫做二元运算符。举的例子重载‘+’有误,必须加friend才能有两个参数
如果运算符被重载为类的成员函数,那么一元运算符没有参数,二元运算符只有一个右侧参数,因为对象自己成了左侧参数。对于这一点我持怀疑态度,重载的‘=’应该是一元,按上述说法就是二元;另外加上friend后重载‘+’有两个参数,它是二元且左右都有参数。
② 可重载的操作符规则表
运算符 | 规则 |
所有的一元运算符 | 建议重载为成员函数 |
= () [] -> | 只能重载为成员函数 |
+= -= /= *= &= |= ~= %= >>= <<= | 建议重载为成员函数 |
所有其它运算符 | 建议重载为全局函数 |
③ 不能被重载的运算符
在C++运算符集合中,有一些运算符是不允许被重载的。这种限制是出于安全方面的考虑,可防止错误和混乱。
(1)不能改变C++内部数据类型(如int,float等)的运算符。
(2)不能重载‘.’,因为‘.’在类中对任何成员都有意义,已经成为标准用法。
(3)不能重载目前C++运算符集合中没有的符号,如#,@,$等。原因有两点,一是难以理解,二是难以确定优先级。
(4)对已经存在的运算符进行重载时,不能改变优先级规则,否则将引起混乱。
5、 内联函数
① 工作原理:
对于任何内联函数,编译器在符号表里放入函数的声明(包括名字、参数类型、返回值类型)。如果编译器没有发现内联函数存在错误,那么该函数的代码也被放入符号表里。在调用一个内联函数时,编译器首先检查调用是否正确(进行类型安全检查,或者进行自动类型转换,当然对所有的函数都一样)。如果正确,内联函数的代码就会直接替换函数调用,于是省去了函数调用的开销。这个过程与预处理有显著的不同,因为预处理器不能进行类型安全检查,或者进行自动类型转换。假如内联函数是成员函数,对象的地址(this)会被放在合适的地方,这也是预处理器办不到的。
C++ 语言的函数内联机制既具备宏代码的效率,又增加了安全性,而且可以自由操作类的数据成员。所以在C++ 程序中,应该用内联函数取代所有宏代码,“断言assert”恐怕是唯一的例外。assert是仅在Debug版本起作用的宏,它用于检查“不应该”发生的情况。为了不在程序的Debug版本和Release版本引起差别,assert不应该产生任何副作用。如果assert是函数,由于函数调用会引起内存、代码的变动,那么将导致Debug版本与Release版本存在差异。所以assert不是函数,而是宏。
② 慎用内联函数
内联是以代码膨胀(复制)为代价,仅仅省去了函数调用的开销,从而提高函数的执行效率。如果执行函数体内代码的时间,相比于函数调用的开销较大,那么效率的收获会很少。另一方面,每一处内联函数的调用都要复制代码,将使程序的总代码量增大,消耗更多的内存空间。以下情况不宜使用内联:
(1)如果函数体内的代码比较长,使用内联将导致内存消耗代价较高。在只调用一次的极端情况下应该是不会有这种现象的。
(2)如果函数体内出现循环,那么执行函数体内代码的时间要比函数调用的开销大。
此处不是很明白,待研究。
(3) 类的构造函数和析构函数容易让人误解成使用内联更有效。要当心构造函数和析构函数可能会隐藏一些行为,如“偷偷地”执行了基类或成员对象的构造函数和析构函数。所以不要随便地将构造函数和析构函数的定义体放在类声明中。
(4) 一个好的编译器将会根据函数的定义体,自动地取消不值得的内联(这进一步说明了inline不应该出现在函数的声明中)。
我的想法:构造函数和析构函数不要使用内联。