引入cache的原因
局部性原理
cache的工作原理
性能分析
cache与主存的映射关系
全相联映射
任意存放
直接映射
只能存放固定的位置,缺点:如果遇到取余数相同的数据就不能访问,有点因为如果取余数为2的n次方那么后面n位的地址范围都是确定的,所以在cache中可以少记录n位标记
组相联映射
主存与cache的替换算法
随机算法(rand)
先进先出(FIFO)
最近最少使用(LRU)
如果只有4个cache块计数器最多也就是3,所以如果已近有计数器的值为3了,就没有必要再加成4了
最近不经常使用(LFU)
最近不经常访问,看似很科学记录了访问频率最多的块,但是在实际使用过程中,曾经经常使用的块在未来可以并不经常使用,如微信视频,在开视频的时候这部分的块一直不停的访问,计数器的值会被刷的很高,但是关掉视频之后,和视频相关的块需要很长一段时间才会消失,其实并没有遵循局部性原理,而是记录的全局。
cache的写策略(解决cache和内存一致性的问题)
cpu修改了cache里面的数据副本,怎么去确保主存数据母本的一致性?
当CPU命中时
写回法
全写法
写缓冲也是通过SRAM做的,所以写入写缓冲的速度和写出cache的速度差不多
写不命中
写分配法
非写分配法
虚拟内存
同步操作系统虚拟内存(详细内容):https://blog.csdn.net/weixin_43899645/article/details/109153666
分页存储
逻辑地址和物理地址
通过页表就可以知道逻辑地址和物理地址的映射关系
快表
页表的查询依然遵循局部性原理。原理和cache很像,但是作用完全不一样,快表是在地址变换过程中,为了节省页面调用时间,所以才引入快表,快表是一种相联存储器结构是SRAM所以速度很快并且可以按照内容寻址,而cache是为了缓和cpu和内存之间速度不匹配的问题,cache里面装的内容是内存中数据的副本,而快表中装的是内存中页表项的副本。
请求分页存储(虚拟内存)
段式虚拟存储
真题
2020:组相连映射中,tag表示的是组数,LRU表示的是每组块的数
2019:
缺页中断是在地址转换时CPU检测到的一种异常
缺页处理是操作系统提供的缺页处理程序来完成的
缺页处理程序根据页故障地址从外存读入所缺失的页
企业处理完成后回到缺页的指令重新执行
2016:
for(k=0;k<1000;k++){
a[k]=a[k]+32;
}
若数组a及比变量k均为int型,int型数组占4B,数据cache采用直接映射方式,数据区大小为1kB,块大小为16B,给程序段执行前cache为空,则该程序执行过程中访问数组a的Cache缺失率为多少?
解:一个cache块16B,则可以存放4个数,根据局部性原理,当访问了第一个数组的时候,后面相邻的4的数组都被调入cache中,每个数组访问两遍(读取一次,写入一次)则4个数会访问8次数组,而只有第一个数组的第一次访问会缺失,所以缺失率为1/8.后面的数组缺失率是相等的所以循环1000次缺失率还是1/8。
2015:假定主存地址为32位,按字节编址主存和Cache之间才用直接映射方式,主存块大小为4个字,每个字32位,采用回写法方式,则能存放4k字数据的cache的总容量的位数至少是多少?
解:采用直接映射方式,就意味着主存地址分为,块地址(主存字块标记,cache字块标记)和块内地址,主存块的大小为4个字,一个字32位也就是4B,一个块就是16B,按字节编址,则16B占用4位,块内地址就是4位,然后需要cache能够装4k字的数据,一个块的大小是4个字,则4k字需要1k个块,1k个块需要10位来表示,主存一共占用32位,则主存字标记块需要占用18位
cache每个块的总容量包括存储容量和标记阵列容量(有效位,标记位,一致性维护位,和替换算法控制位),有效位和标记位一定是存在的,题目中说采用写回法,所以有一致性维护位,有效位占用一位,标记位占用18位,一致性维护位占用一位,标记阵列容量一共占用20位,cache一共1k个块每个块的标志阵列占用20位,真个cache的标记阵列占用20k位,每个块的容量16B占用128位,真个cache容量占用128k位,加起来为148k位