一、内存黑洞内存泄漏分析
1.1、page owner简介
内核中通过Slab、Vmalloc、Page Cache等接口申请的内存都会被内核统计到,而直接调用alloc_pages或__get_free_pages申请的内存不会被统计而称为所谓的内存黑洞,若在这部分中出现了内存泄漏问题该如何去定位呢?Linux提供了page owner机制用来追踪谁分配的每一个页面,它可以用来调试内存泄漏或找到内存占用者。
当分配发生时,有关分配的信息,如调用堆栈和页面的顺序被存储到每个页面的特定存储中,当我们需要了解所有页面的状态时,我们可以获得并分析这些信息。
page owner特性的总体设计思路非常简单,就是通过扩展struct page结构体,增加成员变量用于存储该page被分配的调用栈及标志位,然后hack内存页的分配和释放接口,在内存页被分配时,保存调用栈信息,设置标志位,在内存页被释放时,清除调用栈信息,清除标志位,然后,通过一个debugfs的接口,将所有读取该接口时刻已经被分配出去的内存页的调用栈信息传递给用户态,并在用户态制作了一个工具,用于统计这些调用栈的信息。
下图就是page owner中统计的信息,这里需要注意的是,记录在page owner文件中的内存页都是已经被申请的,通过这些信息就可以清晰的看到内存页的调用情况。
1.2、page owner内核使能方法
page owner在默认情况下是禁用的,内核中打开page owner的流程如下:
1.2.1、使能内核宏定义
如果内核没有打开相关宏定义的话,则需要手动使能。
CONFIG_DEBUG_FS=y
CONFIG_PAGE_OWNER=y
1.2.2、启动参数中使能
在boot cmdline中新增"page_owner=on"。
1.2.3、检测使能结果
若成功使能的话,就可以查看到/sys/kernel/debug/page_owner节点,如下图所示,
1.3、page owner分析内存泄漏流程
1、在内存泄漏问题压测前后