首先在单个计算机里的存储分为带电存储和不带电存储,所谓带电存储的意思就是有电才能存储,例如电脑的内存,需要通电之后才能进行存储--主存,而所谓不带电存储就是一些磁盘,硬盘。这些东西能在没有电的情况下进行存储--本地二级存储。还有一种是远程二级存储,分布式文件系统,web网络服务器。例如百度网盘等等,利用网络传输进行存储。
如下图中,主存(包括主存)往上都是带电存储,往下是不带电存储。
在往上还有一些存储,在我们的电脑上还有一些存储--三级缓存和寄存器。这几个是围绕在cpu周围的,因为cpu相对于主存存储的速度来说太快了,主存跟不上cpu的处理速度。再cpu处理主存上一些比较少的数据的时候,例如:a+b比较小,他会把a和b加载到寄存器上面,cpu在寄存器完成处理,然后再把结果传回主存里面。但是寄存器比较小,一般只能存储4-8个字节大小的内存,但是寄存器的速度特别快,如果内存再大一点,就要使用高速缓存了。
现在,假设cpu要去分别遍历顺序表和链表,对于cpu对顺序表的访问,假设访问第一个数据的内存位置0x00123400,他会先看这个地址在不在缓存中,在就直接访问,不在就先加载到缓存,在访问。在计算机执行加载这个操作的时候,他不仅仅只是加载这个一个数据的位置,他还要加载这个数据周围的一片空间的数据,而这片空间的大小取决于你的电脑内存。
假设我们加载的是20个字节,当我们访问你的地址不在缓存中的时候,计算机执行加载这个操作,而这个加载不仅仅只加载这个地址的数据,会把后面20个字节的数据都加载过去。
第二次执行的代码逻辑是要访问顺序表里的第二个位置的数据,同样的计算机会先看这个数据在不在缓存区里,在就直接访问,而我们知道,在寻找第一个数据的时候,计算机就把后面的20个字节的内存都加载到缓存中了,所以计算机就直接访问了。以此类推,这个现象会一直发生到计算机寻找第一个数据的预加载的20个字节都加载完。
而反观链表,我们知道链表的每一个字节差不多都是一块独立的空间,而计算机在一个一个地址的寻找的时候也可能出现上面顺序表的情况,但是这种情况很少,也就是说计算机在每一次寻找数据的时候都要过一遍上述计算机的寻找流程。这就是的链表的命中率没有顺序表高了。
这就是顺序表连续的物理空间带来的优势。