for (i = 0;i < N; i += 1){
for (j = 0;j < N; j += 1){
array[i][j] = 0;
}
}
C++ 代码实现中,array[j][i]执行的时间是 array[i][j]的 8 倍之多
原因:array 所占用的内存是连续的,缓存加载时直接加载64字节的数据,如果用 array[i][j]访问数组元素,则完全与上述内存中元素顺序一致,因此访问 array[0][0]时,缓存已经把紧随其后的 3 个元素也载入了,
array[0][0],array[0][1],array[1][0],array[1][1]
CPU 通过快速的缓存来读取后续 3 个元素就可以。如果用 array[j][i]来访问,访问的顺序就是:
array[0][0],array[1][0],array[0][1],array[1][1]