Cache存储器概述-CSDN博客

本文链接：https://blog.csdn.net/Wanganchuan/article/details/148199414

Cache存储器

主存（通常为DRAM）虽已通过双端口RAM、多模块存储等方式提高访问速度，但与CPU高达数GHz的执行速度相比仍存在巨大差距。

若全部采用速度更快的SRAM芯片替代DRAM，虽然能提升主存性能，但成本高、容量低，芯片集成度限制也不允许Cache做得太大。因此，为缓解CPU与主存之间的速度矛盾，引入一种**“容量小、速度快”的中间缓存层——Cache**是更现实的解决方案。

Cache 的设计依据是程序运行中存在 局部性原理，包括：

最近会被访问的数据，通常位于当前正在访问数据的附近地址。

最近被访问的数据或指令在短时间内可能再次被访问。

策略	命中处理时间	未命中处理时间	平均访问时间公式
先查Cache，再查主存	$t_c$	$t_c + t_m$	$\cdot t_c + (1-H) \cdot (t_c + t_m)$
同时查Cache与主存	$t_c$	$t_m$	$\cdot t_c + (1-H) \cdot t_m$

其中，

若：

则：

为实现局部性的数据批量加载，Cache 和主存都采用 按块划分的存储结构：

若主存为 $4MB = 2^{22}$ 字节，块大小为 $1KB = 2^{10}$ ，则：

每当CPU访问主存某地址，会将该地址所在的整个主存块复制一份到Cache，以便后续快速访问。

Cache虽可提高访问效率，但为确保数据一致性与替换合理性，还需深入研究以下三大问题：

映射方式：
- 如何将主存块映射到有限的Cache块中？
- 如何在Cache中定位某块是否是目标数据？
替换算法：
- 当Cache满时，若要加载新数据，应该替换哪一块？
- 常见策略如LRU（最近最少使用）、FIFO（先进先出）等
写策略：
- CPU修改Cache中的数据后，主存中的数据如何保持同步？
- 写直达（Write Through）或写回（Write Back）机制如何选择？