事情是这样的,写了一个小的Demo,功能是生成一个随机矩阵
A
A
A,然后求逆矩阵
A
−
1
A^{-1}
A−1,然后计算
A
A
A与
A
−
1
A^{-1}
A−1的乘积,最后输出该乘积的对角线元素,看看是否都为
1
1
1. 为了方便,使用了auto
关键字。
该Demo的代码:
int main(int argc, char const *argv[])
{
Eigen::MatrixX<double> P(2048, 2048);
default_random_engine gen(random_device{}());
uniform_real_distribution<double> nrd(0.5, 1.5);
do
{
for (size_t i = 0; i < 2048; i++)
{
for (size_t j = 0; j < 2048; j++)
{
P(i, j) = nrd(gen);
}
}
} while (P.determinant() == 0);
auto P1 = P.inverse();
auto E = P * P1;
for (size_t i = 0; i < 2048; i++)
{
cout << E(i, i) << ' ';
}
return 0;
}
于是诡异的一幕发生了,最后输出1的时候,两个1之间会隔很久的时间。
然而不使用auto时,即将代码中两个auto
都改为Eigen::MatrixX<double>
后,输出就变得正常了,瞬间输出了很多1。
原因,应该是Eigen计算矩阵的运算表达式时,并不会立即计算出结果并存储到新的矩阵里,而是会返一种特殊的类型的矩阵,这个矩阵只记录矩阵运算表达式,在最终需要访问具体元素时才真正计算出表达式结果,以此来进行一些内部优化,减少计算中间矩阵时的开销。
因此在使用auto
时,每一次访问E(i, i)
都会重新计算一边表达式,这一优化反而造成了重复计算。
而如果将表达式的值赋给MatrixX
,则会立即计算出表达式结果,因此在修改后的代码中就会很快输出。