一、strace 是什么?
按照 strace 官网的描述,strace 是一个可用于诊断、调试和教学的 Linux 用户空间跟踪器。我们用它来监控用户空间进程和内核的交互,比如系统调用、信号传递、进程状态变更等。
strace 底层使用内核的 ptrace 特性来实现其功能。
在运维的日常工作中,故障处理和问题诊断是个主要的内容,也是必备的技能。strace 作为一种动态跟踪工具,能够帮助运维高效地定位进程和服务故障。它像是一个侦探,通过系统调用的蛛丝马迹,告诉你异常的真相。
二、strace 能做什么?
运维工程师都是实践派的人,我们还是先来个例子吧。
我们从别的机器 copy 了个叫做 some_server 的软件包过来,开发说直接启动就行,啥都不用改。可是尝试启动时却报错,根本起不来!
启动命令:
./some_server ../conf/some_server.conf
输出:FATAL: InitLogFile failed iRet: -1!
Init error: -1655
为什么起不来呢?从日志看,似乎是初始化日志文件失败,真相到底怎样呢?我们用 strace 来看看。
strace -tt -f