题目描述: 现代计算机系统中通常存在多级的存储设备,针对海量workload的优化的一种思路是将热点内存页优先放到快速存储层级,这就需要对内存页进行冷热标记。 一种典型的方案是基于内存页的访问频次进行标记,如果统计窗口内访问次数大于等于设定阈值,则认为是热内存页,否则是冷内存页。 对于统计窗口内跟踪到的访存序列和阈值,现在需要实现基于频次的冷热标记。内存页使用页框号作为标识。 输入描述: 第一行为输入为N,表示访存序列的记录条数,0<N<=10000 第二行为访存序列,空格间隔的N个内存页框号,页框号范围0—65535,同一页框号可能重复出现,出现的次数即为对应页框号的频次。第三行为热内存页的频次阈值T,正整数,范围1<=T<=10000 输出描述: 第一行输出标记为热内存的内存页个数,如果没有被标记为热内存的,则输出0。 如果第一行>0,则接下来按照访问频次降序输出内存页框号,一行一个, 频次一样的页框号,页框号小的排前面。补充说明: 示例1 输入: 10 1 2 1 2 1 2 1 2 1 2 5 输出: 2 1 2 说明: 内存页1和内存页2均被访问了5次,达到了阈值5,因此热内存页有2个。 内存页1和内存页2的访问频次相等,页框号小的排前面。
解决思路:
1、统计频次:使用一个字典来统计每个内存页框号在访存序列中的出现次数。 2、过滤热内存页:遍历字典,将访问频次大于或等于阈值 T的页框号筛选出来。 3、排序并输出:将这些热内存页按照频次降序排列,如果频次相同则按页框号从小到大排序。
代码部分
def find_hot_page(n, pages, time):
frequences = {}
#1.类似hash表,统计各个内存页的频次
for page in pages:
if page in frequences:
frequences[page] += 1
else:
frequences[page] = 1
#2.过滤热内存页
hot_pages = [page for page, count in frequences.items() if count >= time]
#3排序热内存页
# -frequences[x]指按照frequences[x]的值降序排序,值相同时再按照x大小(默认)升序排序
hot_pages.sort(key=lambda x: (-frequences[x], x))
if hot_pages:
print(len(hot_pages))
for page in hot_pages:
print(page)
else:
print(0)
n = int(input())
pages = list(map(int, input().split()))
time = int(input())
find_hot_page(n, pages, time)
知识点:哈希表,列表、排序
结语:越简单的题目解法应该越多,请路过大神留下新的思路供本小白学习一下,打开思路