为了弥补内存的速度低下问题,处理器内部会放置一些SRAM做cache(缓存),来提高处理器访问程序和数据的速度。cache作为连接内核和内存的桥梁。
1、cache的时间局限性和空间局限性
时间局限性(temporal locality):如果某个数据被访问,那么在不久的将来它很可能再次被访问。典型例子就是循环。代码段
空间局限性(spatial locality) :如果某项数据被访问,那么与它相邻的数据很可能很快被访问。典型例子就是数组。数据段
2、cache的层次——层次化管理
3、cache的工作方式——命中与未命中
整个cache空间被分成了N个line,每个line(cache line)通常是32byte、64byte等。cache line 是cache和内存交换数据的最小单位。
4、cache的映射方式——多对一的策略
(1)全关联cache(full-associative cache)
实际处理器中,这种方式很少用。
(2)直接映射cache(direct-mapped cache)
处理器比较常用的方式。
(3)组关联cache(set-associative cache)
5、cache的写方式
(1)write through(写通)
策略是:每次CPU修改了cache中的内容,cache 立即更新内存的内容。
(2)write back(写回) 处理器一般使用此方式
策略是:每次CPU修改了cache中的内容,cache不立即更新内存的内容,而是等到这个cache line 因为某种原因需要从cache中移除时,cache才更新内存中的数据。
6、cache一致性的底层操作
处理器提供了两个保证cache一致性的底层操作:write invalidate和write update。
write invalidate(置无效):当一个内核修改了一份数据,其他内核上如果有这份数据的复制,就置成无效(invalid)。大多处理器使用该策略。
write update(写更新):当一个内核修改了一份数据,其他地方如果有这份数据的复制,就都更新到最新值。
7、cache miss的原因
(1)compulsory(必须的) miss:第一次访问程序或数据时,这些数据没有在cache中,于是就导致了cache miss。
(2)capacity(容量)miss:cache容量毕竟有限,当cache已满,新数据又要进来,就必须重新搬移。
(3)conflict(冲突)miss:有时候cache虽然还要空闲空间,但是这个地址对应的cache line 已经被使用了,也会导致cache miss。