工作集模型(Working-set model)用于解决“为每一个进程分配多少内存页面”的问题,其思路是:查找进程最近引用的页面数量。
在工作集中,需要定义Δ(也称为工作集窗口)是一个固定的页面引用数量,它表示了一个时间段内的内存访问情况。通常,Δ 的值是一个固定的整数,例如10,000个指令。对于每个进程 Pi,可以定义其工作集 WSSi(Working Set of Process Pi),它表示在最近Δ个引用(通常是指令引用)中所引用的页面总数。
(比如说Δ=3举个例子,引用了1,2,3则WSSi就是3,引用了1,1,1则WSSi就是1)
-
如果一个进程的工作集大小很小,那么它可能只需要较少的页面来支持其工作负载,因此可以分配较少的页面帧给该进程。
-
如果一个进程的工作集大小很大,那么它可能需要更多的页面来支持其工作负载,因此可以分配更多的页面帧给该进程。
比如说,A进程最近引用了10000次页面,但是这10000次只涉及到了20个不同的页面,B进程最近引用了10000次页面,但是涉及到3000个不同的页面,那么A进程分配到的页面显然就应该比B进程少。
工作集的大小会随着时间的推移而变化,所以也需要定时更新工作集。
设置一个定时器,定期触发中断。例如,假设Δ = 10,000,系统可以设置定时器在每5000个时间单位后触发一次中断。在中断之后,需要检查哪些页面被引用了,所以为每个页面维护一个或多个引用位。在工作集估算中,通常使用两个引用位。具体来讲一下两个引用位的功能:
-
第一个引用位:这个位被用来标识在最近的一个时间单位(比如上述例子中的5000个时间单位)内,页面是否被访问过。每次页面被访问时,这个位会被设置为1。当定时器触发中断时,操作系统会检查这个位,并且在处理完中断后将其重置为0。
-
第二个引用位:这个位通常用于记录在前一个时间单位内是否有访问发生。当第一个引用位在中断处理时被重置为0时,第二个引用位会被设置为之前第一个引用位的值。这样,第二个引用位实际上代表在上一个时间单位内的页面访问情况。这提供了关于页面访问的更长期的视角。