内存泄露问题分析方法

内存泄露问题在一些压力测试的场景很容易暴露,例如一些常用应用场景反复操作(eg:反复切换前后摄像头,反复进入退出相机应用、压力拍照等等)。

内存泄露一般表现为:

内存分配释放,导致进程空间虚拟地址被分配完,或者物理地址被分配完。

文件泄露,导致进程空间文件句柄数达到最大值。

线程泄露,导致进程空间虚拟地址被分配完,进程内保留很多线程栈(stack)。


Android Native层中大部分的泄露问题都在HAL层,主要导致原因就是一些非对称操作。

1. 工具

这一层主要使用工具为Linux自带的工具以及一些文件节点的状态。

命令列表:

ps  [-t] [pid] [ | busybox wc -l ]

top [-t]

ll /proc/pid/fd [ |busybox wc -l ]

cat /proc/pid/maps [ |busybox wc -l ]

cat /proc/meminfo [ | grep "MemFree" ]

dumpsys meminfo [ pid ] [ package name ]

procrank valgrind

valgrind



2. ps / top命令

ps /top 可以对linux系统中进程进行监测和控制。Ps 是显示瞬间进程的状态;Top是对进程运行时间监控。

Ps/top命令查找到目标的进程号pid,再根据pid去观测反复操作中Ps/top的两项打印项:

VSIZE(VSS)  :占用的虚拟内存的大小。

RSS :占用内存的大小。

确认下这两项是否一直在无限制增大,这样子可以初步确认一下内存泄露问题的存在性

ps -t pid 这个命令可以列出当前进程所有线程,包括native线程和java线程。

native线程可以查看到其线程名,如:

USER     PID   PPID  VSIZE  RSS     WCHAN    PC         NAME

media     1574  1465    50312  9992   c0089920   b6ea491c SCameraCaptureTh

 

Java 线程只能看到java线程在native层的映射名

USER     PID   PPID  VSIZE  RSS  WCHAN   PC       NAME

u0_a22    6884  2562  984204 54004 c0089920  4010491c SThread-194

 

查线程是否泄露技巧:可以在相同的状态反复使用下面命令,如在每次应用打开关闭后使用,这个命令可以统计目标进程内所有的线程数,这个数一直在增加的话,说明进程内存在进程内有线程没有正常被释放。

ps -t pid | busybox wc -c

 


3. proc进程状态节点

Linux proc虚拟文件系统中会记载系统所有进程的一些状态信息,在/prco下会有进程目录,目录名就是pid。pid文件夹下信息量非常庞大,现在只介绍两个与查内泄漏相关的:fd目录和maps节点。

root@kylin-wt097:/ # ps mediaserver

USER     PID   PPID  VSIZE  RSS   WCHAN    PC         NAME

media     8403  1     240688   16940  ffffffff  b6f225a0 S /system/bin/mediaserver

root@kylin-wt097:/ # ll /proc/8403

 

dr-xr-xr-x media    audio             2012-02-14 12:55 attr

.......................................

dr-x------ media    audio             2012-02-14 12:55 fd

-r--r--r-- media     audio           0 2012-02-14 12:55 maps

.......................................

-r--r--r-- media    audio           0 2012-02-14 12:55 wchan

 

①进程fd目录

可以看出fd目下为文件句柄的链接,例如17为文件句柄号,/system/etc/camera.cfg为打开的文件目录。

root@kylin-wt097:/ # ll /proc/8403/fd

 

lrwx------ media    audio             2012-02-14 13:02 0 -> /dev/null

lrwx------ media    audio             2012-02-14 13:02 1 -> /dev/null

l-wx------ media    audio             2012-02-14 13:02 10 -> /dev/log/system

lr-x------ media    audio             2012-02-14 13:02 11 -> /dev/__properties__

lr-x------ media    audio             2012-02-14 13:02 16 -> /system/etc/camera.cfg

lr-x------ media    audio             2012-02-14 13:0217 -> /system/etc/camera.cfg

l-wx------ media    audio             2012-02-14 13:02 18 -> /dev/cpuctl/apps/tasks

lrwx------ media    audio             2012-02-14 13:02 3 -> /dev/binder

lrwx------ media    audio             2012-02-14 13:02 8 -> /dev/cpuctl/tasks

l-wx------ media    audio             2012-02-14 13:02 9 -> /dev/log/events

.......................................

 

查看系统每个线程的文件句柄最大值,一般系统都会默认一个进程最多有1024个文件句柄,当一个进程打开文件句柄的数量达到1024时,再次创建文件句柄会失败,strerror(errno)会报出“Too many open files”。

cat /proc/pid/limits  |  grep "Max open files"

 

查文件句柄是否泄露技巧:可以在相同的状态反复使用下面命令,如在每次应用打开关闭后使用,这个命令可以统计目标进程内所有文件句柄,这个数一直在增加的话,说明进程内存在进程内有文件句柄没有正常被关闭。

cat /proc/fd | busybox wc -c

 

②进程maps节点

Maps节点可以查询进程的虚内存空间的使用情况。

 

该文件有6列,分别为:

地址:库在进程里地址范围

权限:虚拟内存的权限,r=读,w=写,x=,s=共享,p=私有;

偏移量:库在进程里地址范围

设备:映像文件的主设备号和次设备号;

节点:映像文件的节点号;

路径: 映像文件的路径

root@kylin-wt097:/ # cat /proc/8403/maps

 

a9035000-a9525000 rw-s 98bb3000 00:09 2159       anon_inode:dmabuf

................................................................

a95bf000-a96bc000 rw-p 00000000 00:00 0          [stack:11334]

a99fc000-ab17b000 rw-s 96354000 00:0c 31508      /dev/video0

ab17b000-ac8fa000 rw-s 94bd5000 00:0c 31508      /dev/video0

af7f8000-b0f77000 rw-s 90558000 00:0c 31508      /dev/video0

b0f77000-b26f6000 rw-s 8edd9000 00:0c 31508      /dev/video0

................................................................

 

b26f9000-b27f6000 rw-p 00000000 00:00 0          [stack:11307]

b27f6000-b27f8000 rw-p 00000000 00:00 0

................................................................

b4bb4000-b4bb5000 r--p 00001000 b3:07 1091       /system/lib/libril_audio.so

b4bb5000-b4bb6000 rw-p 00002000 b3:07 1091       /system/lib/libril_audio.so

..................................................................

b6f54000-b6f55000 r--p 0000f000 b3:07 149        /system/bin/linker

b6f55000-b6f56000 rw-p 00010000 b3:07 149        /system/bin/linker

b6f56000-b6f57000 rw-p 00000000 00:00 0

b6f57000-b6f59000 r-xp 00000000 b3:07 162        /system/bin/mediaserver

b6f5a000-b6f5b000 r--p 00002000 b3:07 162        /system/bin/mediaserver

b6f5b000-b6f5c000 rw-p 00000000 00:00 0

b852b000-b859d000 rw-p 00000000 00:00 0          [heap]

bea7c000-bea9d000 rw-p 00000000 00:00 0          [stack]

ffff0000-ffff1000 r-xp 00000000 00:00 0          [vectors]

 

 

32位Liunx系统每个进程有4G地址空间,android系统下进程地址空间分部如下:

                                                                                                           

高位1G空间为内核地址空间,地位3G空间为用户地址空间,可以看出栈stack是有高位向低位增长,而堆heap是由地位向高位增长,还有一段加载动态库的段,可以根据上面的catmaps打印出来对比。

堆泄露的定位方法:

下面是调用mmap映射得到进程虚拟地址,这样的打印持续增多的话,说明进程中有mmap 和 munmap没有对称操作,导致进程虚拟地址的泄露。

ab17b000-ac8fa000 rw-s 94bd5000 00:0c 31508      /dev/video0

 

下面是一个线程栈的使用情况, [stack:11334],11334为线程号tid,这样的打印持续增多的话,说明进程中会持续创建线程,但是没有释放旧线程。

a95bf000-a96bc000 rw-p 00000000 00:00 0          [stack:11334]

 

 

③meminfo节点

proc/meminfo节点记录了系统内存的一些使用情况,主要看MemFree这项。

root@kylin-p1:/ # cat /proc/meminfo

cat /proc/meminfo

MemTotal:        1673008 kB所有可用RAM大小(即物理内存减去一些预留位和内核的二进制代码大小)

MemFree:          761320 kB  LowFreeHighFree的总和,被系统留着未使用的内存

..........................................

Mapped:            87932 kB 设备和文件等映射的大小。

..........................................



4. Android 工具

这是Android上实现的一些命令,在Native这层也可以使用,但是统计的一些信息也和上面的一样。

①dumpsys meminfo [ pid ] [ package name]

可以查看到某个线程(包括应用应用和系统线程)内存使用情况,包括Native堆和java堆。一般用来查java应用的进程,对于系统Native进程,dump出来信息较少。

 

②procrank

Androidprocrank  (/system/xbin/procrank) 工具,能够列出进程所占用的内存使用情况。顺序为从高到低。每个进程占用内存大小以 VSS,  RSS , PSS, USS 的形式列出。为了简化描述,内存占用以页为单位表述,而不是字节。 通常每页为 4096 字节。(和ps功能差不多,数据有少许差异)。

 

③valgrind

android sdk默认集成了valgrind,一款优秀的内存问题检测工具,能够发现内存泄漏。

当前的方案默认没有编译该工具,可以通过以下命令临时编译:

$ cd external/valgrind

$ mm -j16

然后回到android根目录编译生产system.img。对于系统启动运行的进程需要,如debug surfaceflinger,需要在init.rc注释surfaceflinger service,改为命令行启动,

$root@kylin-perf:/ # valgrind --leak-check=full --log-file=/data/valgrind.log /system/bin/surfaceflinger &

 

进行界面的一些简单操作后将surfacelinger进程kill掉,valgrind即会将分析报告输出到/data/valgrind.log,里面信息很多,附上相关的范例log:

关注leak summary:

==1982== LEAK SUMMARY:

==1982==    definitely lost: 58,004 bytes in 477 blocks

==1982==    indirectly lost: 376 bytes in 8 blocks

==1982==      possibly lost: 122,997 bytes in 484 blocks

==1982==    still reachable: 922,973 bytes in 20,141 blocks

==1982==         suppressed: 0 bytes in 0 blocks

==1982== Reachable blocks (those to which a pointer was found) are not shown.

==1982== To see them, rerun with: --leak-check=full --show-reachable=yes

==1982==

==1982== For counts of detected and suppressed errors, rerun with: -v

==1982== Use --track-origins=yes to see where uninitialised values come from

==1982== ERROR SUMMARY: 673822 errors from 827 contexts (suppressed: 0 from 0)



发布了105 篇原创文章 · 获赞 486 · 访问量 58万+
展开阅读全文

没有更多推荐了,返回首页

©️2019 CSDN 皮肤主题: 大白 设计师: CSDN官方博客

分享到微信朋友圈

×

扫一扫,手机浏览