目录
1.前言
Template是个节省时间和避免代码重复的一个方法。不再需要键入20个类似的classes而每一个带有15个成员函数,只需要键入一个class template,留给编译器去具现化那20个你需要的相关classes和300个函数。(class template的成员函数只有在被使用时才被暗中具现化,只有在这300个函数的每一个都被使用,你才会获得这300个函数),function template有类似的诉求。替换写许多函数,只需写一个function template,然后让编译器做剩余的事情。
但如果不小心,使用template可能会导致代码膨胀:其二进制码带着重复的代码,数据。其结果可能是源码看起来合身且整齐,但目标码(object code)却不是那么一回事。
2.实例分析
当你编写某个函数,而你明白其中某些部分的实现码和另外一个函数的实现码实质相同,我们一般会抽象出两个函数的共同部分,把它放进第三个函数中,然后令原先两个函数调用这个新函数。同样的道理,如果你正在编写某个class,而其中的某些部分和另外一个class的某些部分相同,你也不会重复这共同的一部分,取而代之的是你会把共同部分搬移到新的class去,然后使用继承或复合,令原先的1classes取用这共同特性。而原的classes的互异部分仍然留在原位置不动。
编写templates时,也是做相同的分析,以相同的方式避免重复,但其中有个窍门。在non-template代码中,重复十分明确:你可以看到两个函数或两个classes之间有所重复。然而在template代码中,重复是隐晦的:毕竟只有一份template源码,所以必须训练自己去感受当template被具现化时可能发生的重复。
举个例子,假设你想为固定尺寸的正方矩阵编写一个temolate。该矩阵的形式之一是支持逆矩阵运算(matrix inversion)。
template<typename T,std::size_t n>//template支持n,x,n矩阵,
//元素是类型T的objects;见以下关于//size_t参数信息
class SquareMatrix{
public:
...
void invert();//求逆矩阵
};
这个template接受一个类型参数T,除此以外还接受一个类型为size_t的参数那是个非类型参数(non-type parameter)。这种参数和类型参数比较起来不常见,但它们完全合法,就比如本例:
SquareMatrix<double,5> sml;
...
sml.invert();//调用SquareMatrix<double,5>::invert
SquareMatrix<double,10> sm2;
...
sm2.invert();//调用SquareMatrix<double,10>::invert
这会具象化两份invert,这些函数并非完完全全相同,因为其中一个操作的是5*5矩阵而另一个操作的是10*10矩阵,但除来常量5和10,两个函数的其它部分完全相同。这是template引出代码膨胀的一个典型例子。
如果你能看到两个函数完全相同,除了使用5和使用10的区别,本能是为它们建立一个带数值参数的函数,然后以5和10来调用这个带参数的函数,而不重复代码。下面是对SquareMatrix的第一次修改:
template<typename T>
class SquareMatrixBase{
protected:
...
void invert(std::size_t matrixSize);//以给定的尺寸求逆矩阵
...
};
tempalate<typename T,std::size_t n>
class SquareMatrix:private SquareMatrixBase<T>
{
private:
using SquareMatrixBase<T>::invert;//避免遮掩base 版本的invert
public:
...
void invert()
{
this->invert(n);
}
};
正如所看到的,带参数的invert位于base class SquareMatrixBase中,和SquareMatrix一样,SquareMatrixBase也是个template,不同的是它只对”矩阵元素对象的类型“参数化,不对矩阵的尺寸参数化。因此对于给定之元素对象类型,所有矩阵共享同一个SquareMatrixBase class。它们也将因此共享这唯一一个class内的invert。
SquareMatrixBase::invert只是企图成为“避免derived class代码重复”的一种方法,所以它以protected替换public。调用它造成的额外成本应该是0,因为derived classes的inverts调用base class版本时用的是Inline调用。这些函数使用“this->”记号,假设不这样做,模板化基类内的函数名称会被derived classes掩盖。也请注意SquareMatrix和SquareMatrixBase之间的继承关系是private。这反映一个事实:这里的base class只是为了帮助derived class实现,不是为了表现SquareMatrix和SquareMatrixBase之间的is-a关系。
当然,这里目前还存在一些问题:SquareMatrixBase::invert如何知道该数据是什么数据,虽然可以从参数中知道矩阵尺寸,但如何知道哪个特定的矩阵的数据在哪?想必只有derived class知道,Derived class如何联络其base class做逆运算操作动作。一个可能的做法是为了SquareMatrixBase::invert添加另一个参数,也许是个指针,指向一块用来放置矩阵数据的内存起点,这个方法行得通。但invert不是唯一一个可写为“形式与尺寸无关并可移动到SquareMatrixBase内的SquareMatrixBase内“的SquareMatrix函数。如果有若干这样的函数,我们唯一要做的就是找出保存矩阵元素值得那块内存。我们可以对所有这样得函数添加一个额外得参数,却得一次又一次地告诉SquareMatrixBase相同地信息,这样似乎不好。
另一个办法是令SquareMatrixBase储存一个地址,指向矩阵数值所在得内存。而它只要存了那些东西,就可能存储矩阵得大小。类似这样:
template<typename T>
class SquareMatrixBase{
protected:
SquareMatrixBase(std::size_t,T* pMem):size(n),pData(pMem)//存矩阵大
//小和一个指针,指向矩阵数值
{
}
void setDataPtr(T* ptr)
{
pData=ptr;
}
....
private:
std::size_t size;//矩阵大小
T* pData;//指针,指向矩阵内容
};
这允许derived classes决定内存分配方式。某些实现版本也许会决定将矩阵数据存储在SquareMatrix对象内部:
template<typename T,std::size_t n>
class SquareMatrix:private SquareMatrixBase<T>
{
public:
SquareMatrix():SquareMatrixBase<T>(n,data) { }//送出矩阵大小和数据指针给base class
....
private:
T data[n*n];
};
这种类型的对象不需要动态分配内存,但对象自身可能性非常大,另一种做法是把每一个矩阵的数据放进heap(也就是通过new 来分配内存);
template<typename T,std::size_t n>
class SquareMatrix:private SquareMatrixBase<T>
{
public:
SquareMatrix():SquareMatrixBase<T>(n,0),pData(new T[n*n])//将base 的数据指针设为null
{ //为矩阵分配内存
this->setDataPtr(pData.get());//将它的一个副本交给base class
}
private:
boost::scoped_array<T> pData;
}
3.总结
(1)Template生成多个classes和多个函数,所以任何template代码都不该与某个造成膨胀的template参数产生联系;
(2)因非类型模板参数而造成的代码膨胀,往往可以消除,做法是以函数参数或class成员变量替换template参数
(3)因类型参数(type parameters)而造成的代码膨胀,往往可降低,做法是让带有完全相同二进制表述的具现类型共享实现码。