PC的浮点计算能力已接近100G,即每秒1000亿次浮点计算。目前,Nvidia GTX 280的双精度浮点运算的峰值已达90G FLOPS;8 core Intel 8核CPU的峰值已达81G FLOPS (数据来自于 http://forums.nvidia.com/index.php?showtopic=75452&hl=double+precision )这些数据也和我自己做的一些测试吻合,从总体上来看,PC上的浮点计算能力已接近100G。按照这个速度,到明年,不到一万元的机器,就可以实现1000亿次浮点计算,技术发展确实惊人!
这段时间GPU运算成了热点,其单精度的性能确实很突出,每秒接近万亿次运算。但双精度计算与CPU相差并不大,甚至存在被CPU反超的可能。而且显存总是要小于内存。因此我觉得对大型矩阵LU分解而言,在未来的几年里,可能还是以CPU计算为主。
图中是Nvidia实测的DGEMM性能。就我个人的一些经验,对XEON有些低估了。