30:透彻了解inlining的里里外外

编译器最优化机制通常被设计用来浓缩那些“不含函数调用”的代码,所以当你inline某个函数,或许编译器就因此有能力对它(函数本体)执行语境相关最优化。

然而inline函数也有使用的代价。

inline函数背后的整体观念是,将“对此函数的每一个调用”都以函数本体替换。因此这样做可能增加你的目标码。

在一台内存有限的机器上,过度热衷inlining会造成程序体积太大(对可用空间而言)。即使拥有虚内存,inline造成的代码膨胀亦会导致额外的换页行为(paging),降低指令高速缓存装置的击中率(instruction cache hit rate),以及伴随这些而来的效率损失。

换个角度说,若inline函数的本体很小,编译器针对“函数本体”所产出的码可能比针对“函数调用”所产出的码更小。

但记住,inline只是对编译器的一个申请,不是强制命令。这项申请可以隐喻提出,也可以明确提出。

隐喻方式是将函数定义于class定义式内:

class Person {
public:
	//...
	int age()const { return theAge; }
	//一个隐喻的inline申请,age被定义于class定义式内。
	//...
private:
	int theAge;
};

这样的函数通常是成员函数,但friend函数也可被定义于class内,若真是那样,它们也被隐喻声明为inline。

明确声明inline函数的做法是在其定义式前加上关键字inline。

例如,标准的max template(来自<algorithm>)往往这样实现:

template<class T>
inline const T& std::max(const T& a, const T& b)//明确声明inline
{
	return a < b ? b : a;
}

上述代码中的max是个template带出了一项观察结果,我们发现inline函数和template两者通常都被定义于头文件内。这使得某些程序员认为function template一定必须是inline,但这个结论是错的。

inline函数通常一定被置于头文件内,因为大多数建置环境(build environment)在编译过程中进行inlining,而为了将一个“函数调用”替换为“被调用函数的本体”,编译器必须知道那个函数长什么样子。inlining在大多数C++程序中是编译期行为。

template通常也被置于头文件中,因为它一旦被使用,编译器为了将它具现化,需要知道它长什么样子。

template的具现化与inlining无关。若你正在写一个template而你认为所有根据此template具现出来的函数都应该inline,请将此template声明为inline;这就是上述std::max代码的作为。但若你认为你写的template没有理由要求它所具现的每一个函数都是inline,就应该避免将这个template声明为inline。

一个表面上看似是inline的函数是否真是inline,取决于你的建置环境,主要取决于编译器。幸运的是大多数编译器提供了一个诊断级别:若它们无法将你要求的函数inline化,会给你一个警告信息。

有时候虽然编译器有意愿inline某个函数,还是可能为该函数生成一个函数本体。

例如,若程序要去某个inline函数的地址,编译器通常必须为此函数生成一个outlined函数本体。

编译器通常不对“通过函数指针而进行的调用”实施inline,这意味着对inline函数的调用有可能被inline,也可能不被inline,取决于该调用的实施方式:

inline void f(){}//假设编译器有意愿inline“对f的调用”
void (*pf)()=f;//pf指向f
//...
f();//这个调用将被inline,因为它是个正常调用
pf();//这个调用或许不被inline,因为它通过函数指针达成

即使你从未使用函数指针,“未被成功inline”的inline函数还是有可能缠住你,因为程序员并非唯一要求函数指针的人,有时编译器会生成构造函数和析构函数的outline副本,如此,它们就可以获得指针指向那些函数,在array内部元素的构造和析构过程中使用。

实际上构造函数和析构函数往往是inline的糟糕候选人,例如

class Base {
public:
    //...
private:
    std::string bm1, bm2;//base成员1和2
};
class Derived :public Base {
public:
    Derived() {}
    //...
private:
    std::string dm1, dm2, dm3;//derived成员函数1-3
};

这个构造函数看起来是inline的绝佳候选人,因为它不包含任何代码。但是你的眼睛可能会欺骗你。

C++对于“对象被创建和被销毁时发生什么事”做了各种各样的保证。

当你使用new,动态创建的对象被其构造函数自动初始化;当你使用delete,对应的析构函数会被调用。当你创建一个对象,其每一个base class及每一个成员变量都会被自动构造;当你销毁一个对象,反向程序的析构行为亦会自动发生。若有个异常在对象构造期间被抛出,该对象已构造好的那一部分会被自动销毁。

在这些情况中,C++描述了什么一定会发生,但没有说如何发生。“事情如何发生”是编译器实现者的权责,但有一点很清楚,就是它们不可能凭空发生。你的程序内一定有某些代码让那些事情发生,而那些代码一定存在于某个地方。

有时就放在你的构造函数和析构函数内,所以可以想象,编译器为稍早说的那个表面上看起来为空的Derived构造函数所产生的代码,相当于以下所列:

Derived::Derived()//“空白Derived构造函数”的观念性实现
{
    Base::Base();//初始化“Base成分”
    //试图构造dm1,
    //若抛出异常就销毁base class成分,
    //并传播该异常
    try { dm1.std::string::string(); }
    catch (/*...*/) {
        Base::~Base();
        throw;
    }
    //试图构造dm2,
    //若抛出异常就销毁dm1、base class成分,
    //并传播该异常
    try { dm2.std::string; :string(); }
    catch (/*...*/) {
        dm1.std::string::string();
        Base::~Base();
        throw;
    }
    //试图构造dm3,
    //若抛出异常就销毁dm2、dm1、base class成分,
    //并传播该异常
    try { dm3.std::string::string(); }
    catch (/*...*/) {
        dm2.std::string::string();
        dm1.std::string::string();
        Base::~Base();
        throw;
    }
}

这段代码并不能代表编译器真正制造出来的代码,因为真正的编译器会以更精致复杂的做法来处理异常。尽管如此,这已能准确反应Derived的空白构造函数必须提供的行为。不论编译器在其内所做的异常处理多么精致复杂,Derived构造函数至少一定会陆续调用其成员变量和base class两者的构造函数,而那些调用(它们自身也可能被inline)会影响编译器是否对此空白函数inline。

相同理由也适用于Base构造函数,所以若它被inline,所有替换“Base构造函数调用”而插入的代码也都会被插入到“Derived构造函数调用”内(因为Derived构造函数调用了Base构造函数)。

若string构造函数恰巧也被inline,Derived构造函数将获得五份“string构造函数代码”副本,每一份副本对应于Derived对象内的五个字符串(两个来自继承,三个来自自己的声明)之一。

现在或许很清楚,“是否将Derived构造函数inline化”并非是个轻松的决定。类似思考也适用于Derived析构函数,在那儿我们必须看到“被Derived构造函数初始化的所有对象”被一一销毁,无论以哪种方式进行。

程序库设计者必须评估“将函数声明为inline”的冲击:inline函数无法随着程序库的升级而升级。换句话,若f是程序库内的一个inline函数,客户将“f函数本体”编进其程序中,一旦程序库设计者决定改变f,所有用到f的客户端程序都必须重新编译。然而,若f是non-inline函数,一旦它有任何修改,客户端只需重新连接就好,远比重新编译的负担少得多。若程序库采取动态连接,升级版函数甚至可以不知不觉地被应用程序吸纳。

经过上述的讨论,对于我们有了一点提示:

一开始先不要将任何函数声明为inline,或至少将inline施行范围局限在那些“一定成为inline”或“十分平淡无奇”的函数身上。

总结

1.将大多数inline限制在小型、被频繁调用的函数身上。这可使日后的调试过程和二进制升级(binary upgradability)更容易,也可使潜在的代码膨胀问题最小化,使程序的速度提升机会最大化。

2.不要只因为function template出现在头文件,就将它们声明为inline。 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值