C++的模板元是在编译期就计算出来的,那么编译期计算也是消耗性能的,在什么情况下会导致编译期由于计算量过大而失败呢,下面看这个例子:
template<size_t A>
struct warp3 {
template<size_t D, typename P = void>
struct imp {
constexpr static size_t value = D + imp<D - 1>::value;
};
template<typename P>
struct imp<0, P> {
constexpr static size_t value = 0;
};
template<size_t ID>
constexpr static size_t value = imp<A + ID>::value;
};
constexpr size_t b3 = warp3<50>::value<1>;
constexpr size_t b4 = warp3<100>::value<1>;
这种情况下,b4无法使用b3的编译结果,导致编译翻倍。最终导致编译器内存爆栈。
但是为了达到编译期的计算效果,需要这么做,那么修需要修改版本,降低编译器的每次计算周期,以下是一个拆分的版本:
我们将这个核心的计算结构体直接移动到了外部。
template<size_t ID>
struct imp2 {
constexpr static size_t value = ID + imp2<ID - 1>::value;
};
template<>
struct imp2<0> {
constexpr static size_t value = 0;
};
// 该结构体直接包含一个变量。
template<size_t A>
struct warp3_ {
constexpr static size_t value = A + imp2<A - 1>::value;
};
constexpr size_t b5 = warp3_<50>::value;
constexpr size_t b6 = warp3_<100>::value;
constexpr size_t b7 = warp3_<150>::value;
constexpr size_t b8 = warp3_<200>::value;
constexpr size_t b9 = warp3_<250>::value;
这样下层使用了上层的编译结果,并且本层的编译次数只有50次,由于imp2是一个全局的方法,所以他在编译期间向下延续,warp3<100>在计算的时候,已经知道warp3<50>的计算结果了,所以编译器直接使用上次的结果,本层直接计算50次便可以了。以此类推。
由于最上面的例子,计算结构体imp2在结构体内部,当出现第二次计算的时候,编译器,无法得知结果,必须重新计算,所以,第一个例子额外浪费了上一次的计算。