1.回顾
我们计算机相关的人士,CPU从内存上取某个变量的值后一定是要存放在当前CPU的寄存器中,
于此同时,还会发生另外一件事,当前的CPU还会将这个变量所处的缓存行复制到当前
CPU的高速缓存上来.(实际上就是该数据所在的一块内存)
2.cache line:缓存行
好了,这个基本过程了解了,再来说一下cache line这个概念:
cache line:是CPU进行缓存时的最小单位,大小一般为32B~256B之间
3.实例:
对于我们的一个数组,他是线性的,假如这个数组中存储的是int型的数据
我们取一个值到CPU得到寄存器上,于此同时还会发生一件事就是CPU还会将这个变量的缓存行范围内的数据
缓存到当前CPU的告诉缓存上,这个缓存范围指的是上面说的32~256B,会缓存这么多的数据.
4.<<深入理解计算机系统>>
遍历数组的实现方法1:
//按行访问
for(int i = 0; i < n; i++) {
for(int j = 0; j < n; j++) {
int num;
arr[i][j] = num;
}
}
遍历数组的实现方法2:
//按列访问
for(int i = 0; i < n; i++) {
for(int j = 0; j < n; j++) {
int num;
arr[j][i] = num;
}
}
分析:
按行读:毋庸置疑,CPU会把数据的缓存行进行缓存,这样没什么问题,以后CPU读取时直接去缓存中读取即可,
就不用去内存中取值了;
按列读:按列读,同样的,读取也会进行缓存,遗憾的是,他是按列进行读取的,缓存是按行缓存的,那么严重的问题
就出现了,缓存的数据是没什么卵用的,其实这就是"缓存失效"或者"缓存未命中"
5.多CPU的缓存过程:
如果说不刷新CPU7的缓存会发生什么:
同时对该数据进行修改,造成回写不一致,这无疑会大大增加软件开发的难度.
实际上,真是的过程可能远比上述过程复杂的多.
未完待续…