干货｜Linux进程函数栈打印工具gstack源码解读、运用及扩展编程

最新推荐文章于 2023-11-21 20:12:35 发布

中兴开发者社区

最新推荐文章于 2023-11-21 20:12:35 发布

阅读量4.1k

点赞数

本文链接：https://blog.csdn.net/O4dC8OjO7ZL6/article/details/78954755

版权

本文介绍了如何利用gstack工具分析Linux服务器程序的函数调用链，通过阅读gstack脚本源码理解其工作原理，并编写扩展脚本进行多次运行和数据净化，以获取不同函数调用栈。通过Node.js程序实现数据排重，最终实现高效地理解和排查程序运行流程。

摘要由CSDN通过智能技术生成

点击上方“中兴开发者社区”，关注我们

每天读一篇一线开发者原创好文

一.需求场景

近期在工作中需要分析一个Linux服务器程序长期运行时的处理流程，想知道程序都执行了哪些函数调用链？比如，假设程序中有数千个函数，有时会触发func1() -> func2() -> func3()调用链；有时会触发func5() -> func2() -> func9()调用链；有时会触发func107() -> func999() -> fun3() -> func557() -> func 123()调用链；等等。通过分析函数调用链，有助于加深理解程序运行流程，便于重点分明地分析和走查源代码，提高工作效率，好处诸多。

二.思路分析

我们知道gdb的bt（backtrace）可以打印函数调用栈，但需要手动敲命令执行，不能批量多次运行，似乎不太方便。有没有更好的工具和方法搞定这个需求呢？有的，gstack就是一款用于方便查看函数调用栈的工具。gstack的用途是“print a stack trace of a running process”，即打印一个正在运行的进程的函数调用栈。下面以一个正在运行的redis-server进程为例，执行gstack `pidof redis-server`即可看到该进程当前正在运行的3个线程各自的函数调用栈。这其实与gdb bt看到的差不多，而且我们的目标是只需要函数名，而不需要地址信息，那么gstack有没有什么参数可以去掉每行的地址，以精简打印呢？

如下所示，gstack竟然没有帮助，这不像是一个正常的程序啊。用file `which gstack`查看，果然，它只是一个脚本，并不是一个正常的程序。

查看/usr/bin/gstack脚本源代码，发现它其实只是包装了gdb bt，并用sed对gdb bt的输出结果做了过滤而已。如下给出gstack脚本源代码的解读，该脚本分为五部分：

第一部分：检查是否提供一个入参，如果入参数量不是1，则打印用法提示，并退出脚本。
第二部分：检查入参必须是一个当前正在运行的程序的PID，如果不是，则退出脚本。
第三部分：判断内核是否支持gdb打印所有线程函数栈，如果不支持，则后续会将“bt”命令输入gdb中；如果支持，则后续会将“thread apply all bt”命令输入gdb中。
第四部分：执行gdb，通过“gdb [options] [executable-file] [process-id]”方式附着到指定PID的进程上，通过<<EOF方式为gdb传入多个命令，并将执行输出的结果通过管道“|”传给后续的sed命令。
第五部分：用sed去掉gdb输出的无效行，只提取含有线程信息、函数信息的行。

通过上述对gstack脚本源代码的分析可知，gstack只是gdb bt的简单封装，与我们的目标还有一定差距。看来需要自己编写一些扩展脚本或程序，才能进一步达成目标。

首先，需要编写一个脚本，重复运行多次gstack，采集目标程序足够多次函数调用栈；其次，需要进一步净化数据，比如函数地址信息就需要过滤掉；还有，需要归并出不同的函数调用栈，找到不同的函数调用链，因为gstack输出的函数栈是用Thread行分隔的，可以编写一个程序来解析Thread行，将每个Thread块（多行）放到哈希桶中排重（即，排除重复项），从而得到唯一不同的函数调用链。

三.扩展编程

首先，编写一个makefile脚本，用shell for循环不断调用gstack，将输出结果追加到临时文本文件中。

仍以redis-server为例，执行 make gstack_log PID=`pidof redis-server` NN=5，即可对redis-server连续运行5次gstack，并将结果保存到一个临时文件tmp_gstack_1353.txt中。在正式采集时，可以将NN设置为很大，比如NN=2000次，以采集到足够多的不同的函数调用栈信息。

然后，查看一下输出的临时文件的内容，即多次gstack输出结果的罗列。下一步需要将每个Thread行所分隔的块（多行），如块1、块2、块3、块4、、、进行净化和排重。

编写一个Node.js小程序gstack_data_format.js，用于对gstack输出结果净化并排重。程序读入gstack结果文件（如：tmp_gstack_1353.txt），一行一行地读入并累加到一个字符串变量中，遇到Thread行则停止累加，并将该字符串作为KEY添加到一个HASH桶中，因为HASH KEY天然不会重复，利用这个特点进行排重；遇到Thread行后，清空该字符串变量，重新开始累加；依次往复，直到读完整个文件。程序基本流程如下，具体源代码请见本文附录。

如下给出gstack_data_format.js的运行效果。该gstack结果文件为1186行，采集到237个函数栈，进行净化、排重后，得到2个唯一不同的函数调用栈。

四.总结

正如本文我们一步一步所做，对运行的目标进程，执行多次gstack，获得大量函数调用栈，使用Node.js程序净化并排重，准确获得少量的唯一不同的函数调用栈。继而只需要依照这少量函数栈的信息，走查相关源代码。这个方法可以帮助我们快速理清程序的主要流程、便于我们快速走读走查源代码，提高学习和工作的效率。

附：gstack_data_format.js源代码（用于对gstack结果净化排重）

  
  
  
   var fs = require ('fs');
   var async = require ('async');
   var g_iLineMinLen = 4;
   var g_strFilename = 'tmp_gstack.txt';
   if (process.argv.length <= 2) {
      
       console.log ("HELP: ", process.argv[0], process.argv[1], "<GSTACK_FILENAME>");
       process.exit(0);
       return;<

最低0.47元/天解锁文章

中兴开发者社区

关注

0
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
干货｜Linux进程函数栈打印工具gstack源码解读、运用及扩展编程

点击上方“中兴开发者社区”，关注我们每天读一篇一线开发者原创好文一.需求场景近期在工作中需要分析一个Linux服务器程序长期运行时的处理流程，想知道程序都执行了哪些函数调用链？比如，假设程序中有数千个函数，有时会触发func1() -> func2() -> func3()调用链；有时会触发func5() -> func2() -> func9()调用链；有时会触发func107() -> fun
复制链接

扫一扫