(1) 问题
/proc/pid/smaps反应了运行时的进程的内存影响,系统的运行时库(so),堆,栈信息均可在其中看到。下面是libstdc++.so这个文件在一个进程中的映射信息,其中的Size表示线性地址空间大小,Rss表示时间占用的物理内存大小.
Rss=Shared_Clean+Shared_Dirty+Private_Clean+Private_Dirty
其中的Shared_Clean/Shared_Dirty/Private_Clean/Private_Dirty究竟是什么含义?
baidu和google后都没有对此进行说明,对此也困惑了很近,在最近一次问题定位时又迷惑了,这才下决心看代码来才弄清楚。
(2)追根溯源
smaps的相关信息是在proc文件系统中保存的,在proc的文件系统中查看smaps的实现,发现是通过调用show_smap来打印显示信息的。文件:fs/proc/task_mmu.c
该函数传递的参数有一个seq_file的结构,网上搜索,这个东东实质为了取procfs中的内容来设计的,当procfs的内容中大于一个page时,procfs会较慢并且可能出现异常。而seq_file能解决上述的问题。查看这段代码可以发现smaps的信息实质是保存在mss变量中,而mss变量是在walk_page_range来进行计算并填充。walk_page_range的功能如下,就是遍历页表,并调用回调函数进行处理。
回调函数都是定义在mm_walk中。
现在linux的内存管理的页表分了4级目录:页全局目录,页上级目录,页中间目录,页表目录,上面的函数分别对应了上面各级页表目录处理的的回调函数。而show_smaps函数始终是定义了一个页中间目录处理的回调函数:
那就看smaps_pte_range的实现,实质就是对页中间目录对应的页表一个个的扫描:
再往下看就找到了shared/private是如下计算的,可以看出首先是查看该page的引用数,如果引用>1,则归为shared,如果是1,则归为private,同时也查看该page的flag,是否标记为_PAGE_DIRTY,如果不是,则认为干净的。
至此,这个疑惑终于解开了。
(3)结论
查看该page的引用数,如果引用>1,则归为shared,如果是1,则归为private,同时也查看该page的flag,是否标记为_PAGE_DIRTY,如果不是,则认为干净的。