Method of fault Analysis 故障分析方法

1) 描述问题的特征
2) 重现问题
3) 找到更进一步的信息 分析问题过程
4) 详细的想出可能的原因
5) 首先尝试最简单的方法
6) 配置文件
    通过配置文件排查问题时 一定要把原来的配置文件先备份以防万一
    使用工具

启动系统 grub
从光盘启动 boot: linux rescue 进入紧急救援模式
它会从光盘内的kernel 和initrd文件启动
加载驱动 自动寻找硬盘上真正的根文件系统 并挂载到/mnt/sysimage
进入系统之后 执行 #chroot /mnt/sysimage/

root密码丢了
从grub的s 或者1级别 单用户模式启动
或者从紧急救援光盘启动chroot 之后
#passwd root 即可

1 收集数据--
#history 查看此前是否执行了错误
的命令
#grep 搜索关键词
#diff 比较目前配置文件和以前备份过的配置文件异同
#find /dir -cmin -60 查看60分钟之内改变过的文件
#strace command 追踪command
#tail -f logfile 查看日志
如果要获得更详细的信息
    在日志中启用debug级别 记录主机所有操作

2 图形界面出问题

Never debug X while in runlevel 5 !
#system-config-display 重置xwindow的主配文件 使用最基本显卡驱动

3 网络问题

#dig www.redhat.com 无法解析主机名
-->dns服务器是否配置正确-->查看配置文件-->ping dns
-->IP/Gateway/route

4 系统启动问题

默认级别是否为0/6
bootloader 配置问题
/sbin/init进程是否故障
/etc/rc.d/rc.sysinit系统初始化脚本是否被篡改
/etc/rc.d/*
/etc/inittab
/etc/rc.d/rc.local
如果某个配置文件 或者组件 或者内核丢失
查找一下它是由哪个软件包提供的 然后重装此软件包
如果inittab丢了
#rpm -qf /etc/inittab
安装软件包
如果fstab丢了
#fdisk -l 查看分区状况
#lvdisplay 查看各个逻辑卷
等等
然后重建fstab
如果fstab中挂载了某个网络文件系统 而此网络文件系统不在线
所以系统启动时由于挂不上而卡住
此时就用救援光盘进系统修改fstab