Stability
文章平均质量分 95
各种Linux稳定性问题(死机重启、panic、oops)分析和定位思路。
pwl999
莫听穿林打叶声,何妨吟啸且徐行。
展开
-
Linux Kdump 机制详解
文章目录1. 简介1.1 安装1.2 触发 kdump1.3 调试 kdump1.3.1 安装 debuginfo vmlinux1.3.2 编译 kernel1.4 kdump-tools.service 流程分析2. 原理分析2.1 elf core 文件格式3. `/proc/kcore`3.1 准备数据3.2 读取 elf core4. `/proc/vmcore`4.1 准备 elf header (运行在 normal kernel)4.1.1 crash_notes 数据的更新4.1.2 vm原创 2021-07-02 16:16:53 · 3665 阅读 · 0 评论 -
Linux 死机复位(oops、panic)问题定位指南
一个计算机系统和一个人类社会其实是差不多的,系统在运行中碰到的各种bug相当于人类社会中的各种案件:user space发生的bug危害性一般,可能就相当于一般的民事案件;kernel层面发生bug引起系统死机复位,属于性质特别恶劣后果特别严重的刑事案件。既然bug相当于案件,那么我们定位bug的过程和破案是差不多的。一般过程如下:1. 首先我们要保留案发现场。只要bug发生的时候cpu还能执行,大部分的软件bug最后都会落入到cpu的陷阱之中。arm准备了3大陷阱来捕获最后的案发现场:undefin原创 2020-06-23 20:49:09 · 11487 阅读 · 2 评论