问题
项目无法打开,查看PHP日志发现
[10-Oct-2022 09:25:28] WARNING: [pool www] child 30144 exited on signal 11 (SIGSEGV) after 1086.943523 seconds from start
[10-Oct-2022 09:25:29] NOTICE: [pool www] child 13000 started
[10-Oct-2022 09:25:29] WARNING: [pool www] child 29811 exited on signal 11 (SIGSEGV) after 1109.293758 seconds from start
[10-Oct-2022 09:25:29] NOTICE: [pool www] child 13001 started
[10-Oct-2022 09:25:29] WARNING: [pool www] child 30150 exited on signal 11 (SIGSEGV) after 1086.313559 seconds from start
[10-Oct-2022 09:25:29] NOTICE: [pool www] child 13002 started
[10-Oct-2022 09:25:29] WARNING: [pool www] child 29141 exited on signal 11 (SIGSEGV) after 1159.599496 seconds from start
[10-Oct-2022 09:25:29] NOTICE: [pool www] child 13003 started
[10-Oct-2022 09:25:29] WARNING: [pool www] child 29826 exited on signal 11 (SIGSEGV) after 1108.658442 seconds from start
[10-Oct-2022 09:25:29] NOTICE: [pool www] child 13005 started
显示多个进程运行过程中遇到了段错误导致进程异常退出了。
分析过程
日志中的信息表明,进程号为30144 的进程由于收到SIGSEGV信号而退出了。收到这个信号的时候,程序是可以生成core文件的。不过通过日志我们可以知道进程30144 退出时没有生成core文件。因为在php-fpm的日志中,如果退出时生成了core文件,日志中会有“SIGSEGV – core dumped”字样。如:
[20-Feb-2014 08:37:59] WARNING: [pool www] child 15845 exited on signal 11 (SIGSEGV – core dumped) after 1.051001 seconds from start
说明
core dump 文件对于诊断linux中程序的问题非常有用。当程序异常退出的时候,可能会生成core文件。如,程序写一个不属于他的内存,操作系统出于保护,会发信号给程序,程序可能会因此而退出,退出的时候可能会生成core文件。我们可以通过分析core文件,找出程序中那里有内存问题。这篇文章主要是阐述生成core文件需要做的一些设置。
生成core文件
默认linux操作系统是不允许生成core文件的。如下图:
[root@izbp1bllim99f4pkb4xtetz ~]# ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 30138
max locked memory (kbytes, -l) 64
max memory size (kbytes, -m) unlimited
open files (-n) 65535
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 8192
cpu time (seconds, -t) unlimited
max user processes (-u) 30138
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
# core file size (blocks, -c) 0 <--
我们可以通过如下命令解除限制:
[root@izbp1bllim99f4pkb4xtetz ~]# ulimit -c unlimited
[root@izbp1bllim99f4pkb4xtetz ~]# ulimit -a
core file size (blocks, -c) unlimited
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 30138
max locked memory (kbytes, -l) 64
max memory size (kbytes, -m) unlimited
open files (-n) 65535
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 8192
cpu time (seconds, -t) unlimited
max user processes (-u) 30138
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
注意,ulimit -c 的设置仅仅是对你完成设置后启动的进程有效。退出后需要重新配置
永久生效可以把命令加入到 /etc/profile 中。
找到core文件
- 一般情况下,core文件会生成在你执行程序的地方。文件名是core.进程号
指定core文件名和生成目录
- 你也可以指定core文件名和生成目录。在 /etc/sysctl.conf 文件中指定。
[root@izbp1bllim99f4pkb4xtetz ~]# vim /etc/sysctl.conf
kernel.core_uses_pid = 1
kernel.core_pattern = /tmp/core-%e-%s-%u-%g-%p-%t
fs.suid_dumpable = 2
[root@izbp1bllim99f4pkb4xtetz ~]# sysctl -p
参数解释
kernel.core_uses_pid = 1 - 追加进程号到core文件名中
fs.suid_dumpable = 2 - 确保设置属主的进程也可以生成core文件
kernel.core_pattern = /tmp/core-%e-%s-%u-%g-%p-%t - 指定core文件生成的位置和文件名规则。文件名规则可以使用的参数有:
%% - 符号%
%p - 进程号
%u - 进程用户id
%g - 进程用户组id
%s - 生成core文件时收到的信号
%t - 生成core文件的 时间 (seconds since 0:00h, 1 Jan 1970)
%h - 主机名
%e - 程序文件名
gdb分析core文件
重启 php 后查看php-fpm日志,发现了如下记录:
[20-Feb-2014 08:37:59] WARNING: [pool www] child 15845 exited on signal 11 (SIGSEGV – core dumped) after 1.051001 seconds from start
[20-Feb-2014 08:39:04] WARNING: [pool www] child 17803 exited on signal 11 (SIGSEGV – core dumped) after 0.927973 seconds from start
[20-Feb-2014 08:42:18] WARNING: [pool www] child 23491 exited on signal 11 (SIGSEGV – core dumped) after 0.798308 seconds from start
说明,core文件已经生成。
1. 安装 gdb
[root@izbp1bllim99f4pkb4xtetz ~]# yum install -y gdb
使用core文件
gdb -e /path/to/application -c /path/to/corefile