原因
避免CPU空等
程序局部性原理
- 时间的局部性(当前正在使用的程序或指令,将来还会用到。放到cache中,提高效率)
- 空间局部性(当前正在执行的指令,它相邻的指令可能很快就要用到,所以以一个程序块为单位,将主存中的程序块包括它相邻的指令缓存到chache中)
工作原理
以块为单位,地址相同,大小相同。
-
命中与未命中
命中:主存块调入缓存中
未命中:主存块未调入缓存中 -
cache命中率
CPU欲访问的信息在cache中的比率
命中率与cache容量和块长有关
一般每块取4-8个字
块长取一个存取周期内从主存调出的信息长度 -
cache-主存系统的效率
cache基本结构
将主存地址映射到缓存中定位称为地址映射,将主存地址变换成缓存地址称为地址变换,当新的主存块需要调入缓存中,而它的可用位置又被占用时,需根据替换算法解决调入问题
cache读写操作
读
写
cache与主存一致性
- 写直达法:既写入缓存又写入主存。(容易多次写操作)
- 写回法:只写入缓存,当cache数据被替换出去时再写入主存。(允许一段时间缓存和主存不一致,非实时一致),多CPU会有问题,因为每个cpu都会有一个缓存,所以会有多份缓存,产生不一致。
cache改进
- 增加cache的级数(现代cpu都有三级缓存包括片内cache,便外cache)
- 统一缓存和分立缓存(指令cache 和 数据cache 分开)
cache主存地址映射
主存数据块的地址如何映射到cache中的地址的
- 直接映射
- 全相联映射
- 组相联映射
直接映射
映射到一个指定cache块中、
每个缓存块可以和多个主存块对应
每个主存块只能喝一个缓存块对应
结构简单、速度快、冲突可能性大、利用率低
全相联映射
缓存块和主存块多对多的关系,任意存放。
利用率高、遍历所有速度慢
组相联映射
给定块可以放入指定组中。可以放入组中任何位置。
属于上两个的折中方案:
主存中的区可以放入cache中的指定组中。
相较于直接映射:一个块有多个位置
相较于全相联:查找是否调入,查询指定组即可,不需要和每一个比较。
替换算法
可被放入的cache地址都满了,选择cache块退出,替换新主存块。
- 先进先出FIFO
- 近期最少使用算法LRU(比较好的体现了局部性原理)