通过矩阵乘法看内存访问对CPU运算速度的影响

      关于Intel C++编译器和Visual C++编译器的差异块可见“Intel和Microsoft C++编译器在矩阵乘法测试例子中运行时间的差异”,从速度上考量这里仅测试Intel C++编译器的情形。矩阵乘法有普通的按定义的方法和块方法,测试结果表明后者可达到前者的两倍速度。速度和“通过加法运算看内存访问对CPU运算速度的影响”中的结果差不多。程序代码如下:

 

运行结果如下:

规模为640

 

Test PASSED

单精度:

矩阵阶数为 640,普通方法: 0.188000s(2.789Gflops),8x8块方法: 0.250000s(2.097Gflops)

Test PASSED

单精度:

矩阵阶数为 640,普通方法: 0.172000s(3.048Gflops),16x16块方法: 0.125000s(4.194Gflops)

Test PASSED

单精度:

矩阵阶数为 640,普通方法: 0.203000s(2.583Gflops),32x32块方法: 0.078000s(6.722Gflops)

Test PASSED

单精度:

矩阵阶数为 640,普通方法: 0.187000s(2.804Gflops),64x64块方法: 0.078000s(6.722Gflops)

Test PASSED

单精度:

矩阵阶数为 640,普通方法: 0.187000s(2.804Gflops),128x128块方法: 0.079000s(6.637Gflops)

Test PASSED

双精度:

矩阵阶数为 640,普通方法: 0.297000s(1.765Gflops),4x4块方法: 0.343000s(1.529Gflops)

Test PASSED

双精度:

矩阵阶数为 640,普通方法: 0.297000s(1.765Gflops),8x8块方法: 0.281000s(1.866Gflops)

Test PASSED

双精度:

矩阵阶数为 640,普通方法: 0.313000s(1.675Gflops),16x16块方法: 0.156000s(3.361Gflops)

Test PASSED

双精度:

矩阵阶数为 640,普通方法: 0.312000s(1.680Gflops),32x32块方法: 0.141000s(3.718Gflops)

Test PASSED

双精度:

矩阵阶数为 640,普通方法: 0.297000s(1.765Gflops),64x64块方法: 0.156000s(3.361Gflops)

 

规模为1280

 

Test PASSED

单精度:

矩阵阶数为1280,普通方法: 1.328000s(3.158Gflops),8x8块方法: 3.187000s(1.316Gflops)

Test PASSED

单精度:

矩阵阶数为1280,普通方法: 1.313000s(3.194Gflops),16x16块方法: 1.437000s(2.919Gflops)

Test PASSED

单精度:

矩阵阶数为1280,普通方法: 1.328000s(3.158Gflops),32x32块方法: 0.765000s(5.483Gflops)

Test PASSED

单精度:

矩阵阶数为1280,普通方法: 1.360000s(3.084Gflops),64x64块方法: 0.703000s(5.966Gflops)

Test PASSED

单精度:

矩阵阶数为1280,普通方法: 1.391000s(3.015Gflops),128x128块方法: 0.718000s(5.842Gflops)

Test PASSED

双精度:

矩阵阶数为1280,普通方法: 2.750000s(1.525Gflops),4x4块方法: 7.360000s(0.570Gflops)

Test PASSED

双精度:

矩阵阶数为1280,普通方法: 2.688000s(1.560Gflops),8x8块方法: 3.859000s(1.087Gflops)

Test PASSED

双精度:

矩阵阶数为1280,普通方法: 2.641000s(1.588Gflops),16x16块方法: 1.796000s(2.335Gflops)

Test PASSED

双精度:

矩阵阶数为1280,普通方法: 2.625000s(1.598Gflops),32x32块方法: 1.375000s(3.050Gflops)

Test PASSED

双精度:

矩阵阶数为1280,普通方法: 2.687000s(1.561Gflops),64x64块方法: 1.234000s(3.399Gflops)

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值