关闭

cpu cache对程序性能的影响

标签: 数组存储方式cache性能
107人阅读 评论(0) 收藏 举报
分类:

一、补充内容:
  由于计算机的内存是一维的,多维数组的元素应排成线性序列后存入存储器。数组一般不做插入和删除操作,即结构中元素个数和元素间的关系不变。所以采用顺序存储方法表示数组

1、 行优先存储

  将数组元素按行向量排列,第i+1个行向量紧接在第i个行向量后面。
【例】二维数组A[m][n]按行优先存储的线性序列为:
A[0][0]、A[0][1]…A[0][n]、A[1][1]、A[1][1]…A[1][n]…A[m][n]、A[m][1]…A[m][n]
在PASCAL和C语言中数组按行优先顺序存储。

2、 列优先存储

  将数组元素按列向量排列,第i+1个列向量紧接在第i个列向量后面。
【例】二维数组A[m][n]按列优先存储的线性序列为:
A[0][0]、A[1][0]…A[m][0]、A[0][1]、A[1][1]…A[m][1]…A[m][1]、A[0][n]…A[m][n]
ORTRAN语言中,数组按列优先顺序存储。

二、以矩阵乘法为例,了解cpu cache对程序性能的影响

/*square1.cpp*/  
/*未经优化的矩阵乘法程序*/  
#include <iostream>  
using namespace std;  
const int N = 1000;  
int a[N][N] = {0}, b[N][N] = {0}, c[N][N] = {0};  
int main() {  
    int i, j, k;  
    for (i = 0; i < N; i++) {  
        for (j = 0; j < N; j++) {  
            a[i][j] = i+j;  
            b[i][j] = i+j;  
        }  
    }  
    for (i = 0; i < N; i++) {  
        for (j = 0; j < N; j++) {  
            for (k = 0; k < N; k++) {  
                c[i][j] += a[i][k] * b[k][j];  
            }  

        }  
    }  
    return 0;
}
/*square2.cpp*/    
/*优化过的矩阵乘法程序*/    
#include <iostream>    
using namespace std;    
const int N = 1000;    
int a[N][N] = {0}, b[N][N] = {0}, c[N][N] = {0};    
int main() {    
    int i, j, k;    
    for (i = 0; i < N; i++) {    
        for (j = 0; j < N; j++) {    
            a[i][j] = i+j;    
            b[i][j] = i+j;    
        }    
    }    
    for (i = 0; i < N; i++) {    
        for (k = 0; k < N; k++) {    
            for (j = 0; j < N; j++) {    
                c[i][j] += a[i][k] * b[k][j];    
            }    

        }    
    }
    return 0;    
}


  两段程序的唯一差别,就是把 三层循环中的 j 循环 和k 循环的顺序交换了一下。
  square1.cpp中因为第三层循环(最内层循环)是对k进行循环,因此b[k][j]是对b逐列进行访问。我们知道内存中二维数组是以行为单位连续存储的,逐列访问将会每次跳1000*4(bytes)。根据cpu cache的替换策略,将会有大量的cache失效。因此square2.cpp将j循环和k循环交换位置,这样就保证了

c[i][j] += a[i][k] * b[k][j];

  这条语句对内存的访问是连续的,增加了cache的命中率,大大提升了程序执行速度。
  我们来看一下实测效果:(测试环境:64位双核2.4GHz cpu)

这里写图片描述
  执行时间测试:
这里写图片描述

转自:http://blog.csdn.net/dhl0317/article/details/5471601
http://blog.csdn.net/a775700879/article/details/11750703

0
0
查看评论

cache line 对程序性能的影响

http://igoro.com/archive/gallery-of-processor-cache-effects/
  • pngfiwang
  • pngfiwang
  • 2016-01-10 20:57
  • 208

关于CPU Cache和Cache Line

为什么要有CPU Cache 随着工艺的提升最近几十年CPU的频率不断提升,而受制于制造工艺和成本限制,目前计算机的内存主要是DRAM并且在访问速度上没有质的突破。因此,CPU的处理速度和内存的访问速度差距越来越大,甚至可以达到上万倍。这种情况下传统的CPU通过FSB直连内存的方式显然就会因为...
  • midion9
  • midion9
  • 2015-10-29 10:20
  • 1149

Cpu Cache对程序性能分析

转自:http://igoro.com/archive/gallery-of-processor-cache-effects/ Most of my readers will understand that cache is a fast but small type of memory th...
  • cpucooler2011
  • cpucooler2011
  • 2016-01-24 19:23
  • 330

高速缓存对程序性能的影响

本篇博客以“SSD6-Exercise5:Cache Lab”为例,首先介绍存储器的层次结构,重点阐述了提高程序局部性的重要性,以及编写高速缓存友好代码的方法。
  • TomMMRunNEr
  • TomMMRunNEr
  • 2017-12-23 21:32
  • 106

cpu性能探究 :cache line 原理

 参考: 一个讲解Direct Mapped Cache非常深入浅出的文章: http://www.cs.umd.edu/class/sum2003/cmsc311/Notes/Memory/direct.html CPU cache http://en.wikipedia.o...
  • abv123456789
  • abv123456789
  • 2014-10-28 14:13
  • 2070

以矩阵乘法为例,了解cpu cache对程序性能的影响

#include using namespace std; #define N 1000 int a[N][N] = {0}, b[N][N] = {0}, c[N][N] = {0}; int main() { int i, j, k; for (i = 0; i < N;...
  • A775700879
  • A775700879
  • 2013-09-16 23:52
  • 2486

制约程序性能的几大常见因素

计算机程序的性能准寻着木桶原理----木桶能装水的最大体积
  • shenlei19911210
  • shenlei19911210
  • 2014-09-29 20:03
  • 816

Cache 结构对程序性能的影响

Cache结构对程序性能的影响一个例子,我们来看看矩阵乘法中不同循环顺序对程序性能的影响: 写一个c代码,很简单 #include <stdio.h> #include <stdlib.h> #define m 1000float a[m][m]; float b[m][m]...
  • lusongno1
  • lusongno1
  • 2017-03-03 21:07
  • 387

程序性能 CPU cache

对程序优化进行,一般是采用良好的算法,合理使用编程语法,但有些时候我们也要考虑硬件的问题,比如CPU cache的优化。 CPU cache对性能会有什么影响呢,先考虑一个例子: 假设我们需要对一个数组求和,代码如下: int m = 1; for (int i = 0;
  • hongjiqin
  • hongjiqin
  • 2011-08-01 11:57
  • 814

CPU性能的影响因素:主频和架构

主频和架构对CPU性能的影响同样重要,不能够割裂这两个因素来评估CPU的性能。 主频很容易理解,类似于速度,对于同一种架构的CPU,当然是主频越高CPU的速度就越快。 但是,如果CPU的架构不一样,只看主频,基本上无法判断CPU 性能的优劣。那么架构是什么?对于大多数用户比较陌生,是个比较晦涩的技术...
  • qq_20161893
  • qq_20161893
  • 2017-06-07 08:32
  • 445
    个人资料
    • 访问:61603次
    • 积分:1443
    • 等级:
    • 排名:千里之外
    • 原创:73篇
    • 转载:71篇
    • 译文:0篇
    • 评论:4条
    最新评论