CPU缓存的工作原理

最新推荐文章于 2022-06-20 14:11:10 发布

skykill2000

最新推荐文章于 2022-06-20 14:11:10 发布

阅读量471

点赞数

分类专栏： Linux/OS/Driver 文章标签：工作 cache 算法存储 table 制造

Linux/OS/Driver 专栏收录该内容

45 篇文章 0 订阅

订阅专栏

当 CPU 要读取一个数据时，首先会从缓存 (Cache) 中查找，如果找到就立即读取并送给 CPU 处理；如果没有找到，就用相对慢的速度从内存中读取并送给 CPU 处理，同时把这个数据所在的数据块调入缓存中，可以使得以后对整块数据的读取都从缓存中进行，不必再调用内存。

　　通过优化的的读取机制，可以使 CPU 读取缓存的命中率非常高 ( 大多数 CPU 可达 90% 左右 ) ，也就是说 CPU 下一次要读取的数据 90% 都在缓存中，只有大约 10% 需要从内存读取。这大大节省了 CPU 直接读取内存的时间，也使 CPU 读取数据时基本无需等待。总的来说， CPU 读取数据的顺序是先缓存后内存。

　　早期的 CPU 缓存容量很小，并且功能单一， Intel 从 Pentium 时代后把缓存进行了分类，当时集成在 CPU 内核中的缓存已不足以满足 CPU 的需求，而制造工艺上的限制又不能大幅度提高缓存的容量。因此出现了集成在与 CPU 同一块电路板上和主板上的缓存等不同类型，于是当时便把 CPU 内核集成的缓存称为一级缓存 (L1 cache) ，而外部的称为二级缓存 (L2 Cache) ；后来随着生产技术的不断提高，最终二级缓存也被挪进了 CPU 当中。通常一级缓存中还分数据缓存 (Data Cache ， D-Cache) 和指令缓存 (Instruction Cache ， I-Cache) 。二者分别用来存放数据和执行这些数据的指令，而且两者可以同时被 CPU 访问，减少了争用 Cache 所造成的冲突，提高了 CPU 效能。此外， Intel 在 Pentium 4 CPU 中还增加了一种一级追踪缓存，容量为 12KB 。

L1 cache vs L2 Cache

　　用于存储数据的缓存部分通常被称为 RAM ，掉电以后其中的信息就会消失。 RAM 又分两种，其中一种是静态 RAM(SRAM) ；另外一种是动态 RAM(DRAM) 。前者的存储速度要比后者快得多，我们现在使用的内存一般都是动态 RAM 。 CPU 的 L1 级缓存通常都是静态 RAM ，速度非常的快，但是静态 RAM 集成度低 ( 存储相同的数据，静态 RAM 的体积是动态 RAM 的 6 倍 ) ，而且价格也相对较为昂贵 ( 同容量的静态 RAM 是动态 RAM 的四倍 ) 。扩大静态 RAM 作为缓存是一个不太合算的做法，但是为了提高系统的性能和速度又必须要扩大缓存，这就有了一个折中的方法：在不扩大原来的静态 RAM 缓存容量的情况下，仅仅增加一些高速动态 RAM 做为 L2 级缓存。高速动态 RAM 速度要比常规动态 RAM 快，但比原来的静态 RAM 缓存慢，而且成本也较为适中。一级缓存和二级缓存中的内容都是内存中访问频率高的数据的复制品 ( 映射 ) ，它们的存在都是为了减少高速 CPU 对慢速内存的访问。

　　二级缓存是 CPU 性能表现的关键之一，在 CPU 核心不变化的情况下，增加二级缓存容量能使性能大幅度提高。而同一核心的 CPU 高低端之分往往也是在二级缓存上存在差异，由此可见二级缓存对 CPU 的重要性。 CPU 在缓存中找到有用的数据被称为命中，当缓存中没有 CPU 所需的数据时 ( 这时称为未命中 ) ， CPU 才访问内存。从理论上讲，在一颗拥有二级缓存的 CPU 中，读取一级缓存的命中率为 80% 。也就是说 CPU 一级缓存中找到的有用数据占数据总量的 80% ，剩下的 20% 从二级缓存中读取。由于不能准确预测将要执行的数据，读取二级缓存的命中率也在 80% 左右 ( 从二级缓存读到有用的数据占总数据的 16%) 。那么还有的数据就不得不从内存调用，但这已经是一个相当小的比例了。目前的较高端 CPU 中，还会带有三级缓存，它是为读取二级缓存后未命中的数据设计的 — 种缓存，在拥有三级缓存的 CPU 中，只有约 5% 的数据需要从内存中调用，这进一步提高了 CPU 的效率，从某种意义上说，预取效率的提高，大大降低了生产成本却提供了非常接近理想状态的性能。除非某天生产技术变得非常强，否则内存仍会存在，缓存的性能递增特性也仍会保留。

CPU 缓存与内存的关系

　　既然 CPU 缓存能够在很大程度上提高 CPU 的性能，那么，有些朋友可能会问，是不是将来有可能，目前的系统内存将会被 CPU 取代呢？

　　答案应该是否定的，首先，尽管 CPU 缓存的传输速率确实很高，但要完全取代内存的地位仍不可行，这主要是因为缓存只是内存中少部分数据的复制品，所以 CPU 到缓存中寻找数据时，也会出现找不到的情况 ( 因为这些数据没有从内存复制到缓存中去 ) ，这时 CPU 还是会到内存中去找数据，与此同时系统的速度就慢了下来，不过 CPU 会把这些数据复制到缓存中去，以便下一次不用再到内存中去取。也即是说，随着缓存增大到一定程度，其对 CPU 性能的影响将越来越小，在性能比上来说，越来越不合算。

　　就目前缓存容量、成本以及功耗表现来看，还远远无法与内存抗衡，另外从某种意义上来说，内存也是 CPU 缓存的一种表现形式，只不过在速率上慢很多，然而却在容量、功耗以及成本方面拥有巨大优势。如果内存在将来可以做到足够强的话，反而很有取代 CPU 缓存的可能。

缓存的读写算法同样重要

　　即便 CPU 内部集成的缓存数据交换能力非常强，也仍需要对调取数据做一定的筛选。这是因为随着时间的变化，被访问得最频繁的数据不是一成不变的，也就是说，刚才还不频繁的数据，此时已经需要被频繁的访问，刚才还是最频繁的数据，现在又不频繁了，所以说缓存中的数据要经常按照一定的算法来更换，这样才能保证缓存中的数据经常是被访问最频繁的。命中率算法中较常用的 “ 最近最少使用算法 ”(LRU 算法 ) ，它是将最近一段时间内最少被访问过的行淘汰出局。因此需要为每行设置一个计数器， LRU 算法是把命中行的计数器清零，其他各行计数器加 1 。当需要替换时淘汰行计数器计数值最大的数据行出局。这是一种高效、科学的算法，其计数器清零过程可以把一些频繁调用后再不需要的数据淘汰出缓存，提高缓存的利用率。