cpu加速处理数据的方法--计算机组成原理（七）

Jacen.L

于 2025-04-14 08:00:00 发布

阅读量1.4k

点赞数 53

分类专栏：计算机组成原理文章标签：计算机网络

本文链接：https://blog.csdn.net/pietian1157/article/details/147193633

版权

计算机组成原理专栏收录该内容

7 篇文章

订阅专栏

上一节我们讲到了如何做一个最简单的cpu, 现代的CPU相比与早期的CPU有很多进步的地方，是一代又一代人不断创新优化的成果，本篇文章就简单介绍从最简单的cpu到现在的告诉运算的cpu都有什么进步

一、独立电路指令集拓展

用最简单的cpu实现一个乘法或者除法，其实是通过不断加法或者减法来实现的，研究者发现这种方式需要用到的时钟周期多，带来高耗时，于是工程师提出了一种思路是否可以用复杂度替换时间的消耗，设计了很多具有独立功能的计算单元，例如乘法器，除法器等等，使cpu的复杂度更高了，但是制行了更快速。现在cpu设计了专门的电路来处理图形操作，解码压缩，加密等运算，例如MMX,SSE, 3DNOW等指令集，MMX用多位并行运算可以同时计算8-16个数的加减运算，达到快速计算的目的

随着越来越多的独立电路加入，指令集也越来越多，现在intel拥有上千个指令集来加速cpu的运算

二、快速传递数据给CPU

早期的CPU，RAM是在cpu外部它们之间用总线链接，CPU每秒可以执行上亿个指令，但是数据存储在RAM当中，每次读取数据都得获取指令，解码，执行，才能将数据加载进cpu，这样就浪费了很多的时钟周期，cpu空等数据。

解决方法是在cpu内部增加一块内存的缓存，一般只有几KB，而RAM一般都有几GB，所以每次cache都是读取一小块RAM内的内存到cache内，虽然花时间比较久，但是一小块内存都读取进cpu，由于连续的数据一般都是有关联，cpu读取数据一般也是顺序读取的，也避免了CPU多次读取RAM。

如果CPU需要读取的数据已经在CACHE内叫做缓存命中（CACHE HIT），反之叫做缓存未命中（CACHE MISS）这也是衡量一个程序效率的指标。

假设CPU写了一块CACHE内的数据，此时CACHE内的数据就和RAM内的数据不同步了，因此每一块缓存内都有一个标记，科学家叫做脏位（Dirty Bit），同步一般发生在cache缓存满了，cpu又需要读取数据的时候，在加载新的内容进CACHE的时候，会先检查脏位，如果是脏的，则会先将CACHE内容写回RAM，再进行读取。