stap是linux服务端 跟踪/探测 调试的工具,详见 stap经典教程
适用于多进程调试,例如nginx,同时避免了gcore/gdb的麻烦。
本文入门介绍2则入门用法
查二进制的代码行
以nginx举例
命令为,其中ngx_rtmp_relay_switch_fail是自定义函数
$stap -l 'process("/home/admin/bin/nginx").function("ngx_rtmp_relay_switch_fail")'
输出如下,可见ngx_rtmp_relay_switch_fail所在文件位置为/home/admin/ngx_rtmp/ngx_rtmp_relay_switch_module.c:310
process("/home/admin/code/bin/nginx").function("ngx_rtmp_relay_switch_fail@/home/admin/ngx_rtmp/ngx_rtmp_relay_switch_module.c:310")
这种方法,也可以查询内核函数,例如printf
打印程序堆栈和变量
以c代码为例
#include <stdio.h>
typedef struct policy {
int id;
} policy_t;
int add(int a, int b)
{
return a + b;
}
int main(int argc, char *argv[])
{
policy_t policy;
policy_t *p = &policy;
policy_t **pp;
p->id = add(1, 2);
printf("before stap set, p->id: %d\n", p->id);
pp = &p;
printf("after stap set, p->id: %d, (*pp)->id: %d\n", p->id, (*pp)->id);
return 0;
}
编译指令,gcc
gcc -Wall -g -o ./stap_set_var ./stap_set_var.c
编写探测脚本stap_set_var.stp,注意是 函数名 + 文件行 的形式
probe process("./stap_set_var").statement("add@./stap_set_var.c:9")
{
//$p->id = 222;
print_ubacktrace()
printf("$a$: %s\n", $a$)
}
以root权限运行探测脚本
sudo stap stap_set_var.stp
可见打印a的值和相应的代码堆栈
扩展
上述代码加-g参数运行stap脚本,可以动态修改c二进制的运行结果,指令如下
sudo stap -g stap_set_var.stp -c ./stap_set_var