文章目录
导读:
在处理Linux系统出现的各种故障时,故障的症状是最容易发现的,而导致这一故障的原因才是最终排除故障的关键。熟悉Linux 系统中常见的日志文件,了解一般故障的分析与解决办法,将有助于管理员快速定位故障点,“对症下药”,及时解决各种系统问题。另外,之前我们学习过在Linux系统下通过分区、格式化来创建文件系统,而文件系统的运行又与block 和inode 有关。
以下主要来深入地了解Linux系统的文件系统和日志文件分析,并通过一些实例介绍常见系统故障的分析与排除过程。由于故障现象的不确定性,在进行一些模拟故障的操作之前,一定要提前做好数据备份。
1.深入理解Linux文件系统
崭新的操作系统的文件数据除了实际内容外,通常包含非常多的属性,例如Linux操作系统的文件权限(rwx)与文件属性(所有者、群组、时间参数等)。文件系统通常会将这两部分分别存放在inode 和block 中。
1.1 inode和block概述
1) 概述
- 文件是存储在硬盘上的,硬盘的最小存储单位叫做“扇区”(sector),每个扇区存储512字节。
- 一般连续八个扇区组成一个"块"(block),一个块是4K大小,是文件存取的最小单位。操作系统读取硬盘的时候,是一次性连续读取多个扇区,即一个块一个块的读取的。
- 文件数据包括实际数据与元信息(类似文件属性)。文件数据存储在“块”中,存储文件元信息(比如文件的创建者、创建日期、文件大小、文件权限等)的区域就叫做inode。因此,一个文件必须占用一个 inode,并且至少占用一个 block。
- inode不包含文件名。文件名是存放在目录当中的。Linux 系统中一切皆文件,因此目录也是一种文件。
- 每个inode都有一个号码,操作系统用inode号码来识别不同的文件。Linux系统内部不使用文件名,而使用inode号码来识别文件。对于系统来说,文件名只是inode号码便于识别的别称,文件名和inode号码是一一对应关系,每个inode号码对应一个文件名。
- 所以,当用户在Linux系统中试图访问一个文件时,系统会先根据文件名去查找它对应的inode号码;通过inode号码,获取inode信息;根据inode信息,看该用户是否具有访问这个文件的权限;如果有,就指向相对应的数据block,并读取数据。
2 )inode的内容
一、inode包含文件的元信息
- 文件的字节数
- 文件拥有者的User ID
- 文件的Group ID
- 文件的读、写、执行权限
- 文件的时间戳
…
二、查看inode信息
用stat命令可以查看某个文件的inode信息
“df -i”命令可查看每个硬盘分区对应的的 inode 总数和已经使用的inode 数量。
■ Linux系统文件三个主要时间属性
- atime(access time) #最后一次访问文件或目录的时间
- ctime(change time) #最后一次改变文件或目录(属性)的时间
- mtime(modify time) #最后一次修改文件或目录(内容)的时间
3) 目录文件结构
- 目录也是一种文件
- 每个inode都有一个号码,操作系统用inode号码来识别不同的文件
- Linux系统内部不使用文件名,而使用inode号码来识别文件
- 对于用户,文件名只是inode号码便于识别的别称
4)inode号码
表面上,用户是通过文件名来打开文件,实际上,在系统内部这个过程分成三步:
- 系统找到这个文件名对应的inode号码
- 通过inode号码,获取inode信息
- 根据inode信息,找到文件数据所在的block,读出数据
查看inode号码的方法
ls -i命令:查看文件名对应的inode号码
由此可知,当一个用户在Linux系统中试图访问一个文件时,系统会先根据文件名去查找它的inode,看该用户是否具有访问这个文件的权限,如果有,就指向对应的数据block,如果没有,就返回Permission denied。而一块硬盘分区后的结构则是如下图所示
5)inode的大小
inode也会消耗硬盘空间,所以格式化的时候,操作系统自动将硬盘分成两个区域。一个是数据区,存放文件数据;另一个是 inode 区,存放 inode 所包含的信息。每个 inode 的大小,一般是 128 字节或 256 字节。
- 在格式化文件系统的时候就确定了inode 的总数
- “df -i”命令可查看每个硬盘分区对应的的 inode 总数和已经使用的inode 数量。
6)inode特殊作用
由于inode号码与文件名分离,导致一些Unix/Linux系统具有以下的现象
- 当文件名包含特殊字符,可能无法正常删除文件,直接删除inode,也可以删除文件
- 移动或重命名文件时,只改变文件名,不影响inode号码
- 打开一个文件后,系统通过inode号码来识别该文件,不再考虑文件名
- 文件数据被修改保存后,会生成一个新的 inode 号码
7)通过删除inode号删除文件
find ./ -inum “inode 号” -exec rm -i {} \;
或
find ./ -inum “inode 号” -delete
1.2inode节点耗尽故障处理
由于每个文件都必须有一个inode,因此有可能发生inode已经用光,但是硬盘还未存满的情况。这时,就无法在硬盘上创建新文件。
模拟inode节点耗尽故障处理
步骤总汇
1、使用fdisk创建分区/dev/sdb1,分区大小30M即可
fdisk /dev/sdb
mkfs.ext4 /dev/sdb1 #这边我们用ext4类型的文件系统进行模拟
mkdir /test
mount /dev/sdb1 /mnt
df -i
2、模拟inode节点耗尽故障
for ((i=1; i<=7680; i++));do touch /test/file$i;done
或者 touch {1..7680}.txt
df -i
df -hT
3、删除文件恢复
rm -rf /test/*
df -i
df -hT
1、使用fdisk创建分区/dev/sdb1,分区大小30M即可
2、格式化成ext4格式
3、进行挂载,并删除挂载目录内已有文件
4、模拟故障
可以看到磁盘空间使用率仅为4%,但inode 已用100%,
可见data目录下已无法创建文件
5.恢复方式:删除无用文件,以恢复节点数
1.3文件误删除处理办法
我们删除一个文件,实际上并不清除inode的数据,只是在这个文件的父目录里面的block中,删除这个文件的名字。Linux是通过Link的数量来控制文件删除的,只有当一个文件不存在任何Link 的时候,这个文件才会被删除。
针对Linux 下的EXT 文件系统,可用的恢复工具有debugfs、ext3grep、extundelete 等。其中extundelete 是一个开源的Linux数据恢复工具,支持ext
、ext4 文件系统。
操作步骤
1、使用fdisk创建分区/dev/sdb1,格式化ext3文件系统
fdisk /dev/sdb
mkfs.ext3 /dev/sdb1
mkdir /data
mount /dev/sdb1 /data
df -hT
2、安装依赖包
yum -y install e2fsprogs-devel e2fsprogs-libs
3、编译安装 extundelete
cd /data 切换到test目录中
wget http://nchc.dl.sourceforge.net/project/extundelete/extundelete/0.2.4/extundelete-0.2.4.tar.bz2 #联网下载安装包
tar jxvf extundelete-0.2.4.tar.bz2 #解压tar包
cd extundelete-0.2.4/ #切换到解压出来的目录中
./configure --prefix=/usr/local/extundelete && make && make install #指定安装目录,开始安装
ln -s /usr/local/extundelete/bin/* /usr/bin/ #创建软连接,让系统识别命令
4、模拟删除并执行恢复操作
cd /data
echo a>a
echo a>b
echo a>c
echo a>d
ls
extundelete /dev/sdb1 --inode 2 #查看文件系统/dev/sdb1下存在哪些文件,i 节点是从 2 开始的,2 代表该文件系统最开始的目录。
rm -rf a b
extundelete /dev/sdb1 --inode 2
cd ~
umount /test
extundelete /dev/sdb1 --restore-all #恢复/dev/sdb1 文件系统下的所有内容
#在当前目录下会出现一个RECOVERED_FILES/目录,里面保存了已经恢复的文件
ls RECOVERED_FILES/
实验操作:
1、直接用之前的sdb1,先解挂载,再重新格式化。
2、用yum方式安装依赖包
3、安装extundelete软件
4、模拟删除并恢复
查看a、b已被删除
1.4xfs 类型文件备份和恢复
- CentOS 7 系统默认采用 xfs类型的文件,xfs 类型的文件可使用 xfsdump 与 xfsrestore 工具进行备份恢复。
- xfsdump 的备份级别有两种:0 表示完全备份;1-9 表示增量备份。xfsdump 的备份级别默认为 0。
xfsdump 的命令格式为:
xfsdump -f 备份存放位置 要备份的路径或设备文件
xfsdump使用限制:
1.只能备份已挂载的文件系统
2.必须使用root的权限才能操作
3.只能备份XFS文件系统
4.备份后的数据只能让xfsrestore解析
5.不能备份两个具有相同UUID的文件系统(可用 blkid命令查看)
命令常用的选项 | 作用 |
---|---|
-f | 指定备份文件目录 |
-L | 指定标签 session label |
-M | 指定设备标签 media label |
-s | 备份单个文件,-s 后面不能直接跟路径 |
步骤:
1、使用fdisk创建分区/dev/sdb1,格式化xfs文件系统
fdisk /dev/sdb
partprobe /dev/sdb #重读分区表,磁盘查询不到时使用
mkfs.xfs [-f] /dev/sdb1
mkdir /data
mount /dev/sdb1 /data/
cd /data
cp /etc/passwd ./
mkdir test
touch test/a
2、使用 xfsdump 命令备份整个分区
rpm -qa | grep xfsdump
yum install -y xfsdump
xfsdump -f /opt/dump_sdb1 /dev/sdb1 [-L dump_sdb1 -M sdb1]
3、模拟数据丢失并使用 xfsrestore 命令恢复文件
cd /data/
rm -rf ./*
ls
xfsrestore -f /opt/dump_sdb1 /data/
步骤图示:
1.新建分区
2.格式化分区,并挂载,复制实验内容到挂载目录,创建目录和子文件
2.使用 xfsdump 命令备份整个分区
2.系统日志
1.日志文件
1.1 日志的功能
-
用于记录系统、程序运行中发生的各种事件
-
通过阅读日志,有助于诊断和解决系统故障
1.2 日志的分类
■内核及系统日志 -
由系统服务 rsyslog 统一进行管理,日志格式基本相似
-
主配置文件 /etc/rsyslog.conf
■用户日志 -
记录系统用户登录及退出系统的相关信息
-
主配置文件/var/log/secure
■程序日志 -
由各种应用程序独立管理的日志文件,记录格式不统一
-
1.3 系统日志默认保存位置
系统日志文件都默认放在目录/var/log/下
1.4常见的一些日志文件
内核及公共消息日志:
/var/log/messages:记录Linux内核消息及各种应用程序的公共日志信息,包括启动、To错误、网络错误、程序故障等。
对于未使用独立日志文件的应用程序或服务,一般都可以从该日志文件中获得相关的事件记录信息。
#计划任务日志:
/ var/ log / cron:记录crond计划任务产生的事件信息。
#系统引导日志:
/var/log/dmesg:记录Linux系统在引导过程中的各种事件信息。
#邮件系统日志:
/var/ log/maillog:记录进入或发出系统的电子邮件活动。
#用户登录日志:
/var/log/security:记录用户认证相关的安全事件信息。
/var/log/lastlog:记录每个用户最近的登录事件。二进制格式
/var/log/wtmp:记录每个用户登录、注销及系统启动和停机事件。二进制格式
/var/run/btmp:记录失败的、错误的登录尝试及验证事件。二进制格式
2.内核及系统日志
由系统服务 rsyslog 统一进行管理
- 软件包:rsyslog-7.4.7-16.el7.x86_64、
- 主要程序:/sbin/rsyslogd
- 配置文件:/etc/rsyslog.cont
2.1 查看rsyslog.conf配置文件
vim /etc/rsyslog.conf #查看rsyslog.conf配置文件
*.info;mail.none;authpriv.none;cron.none /var/log/messages
*.info #表示info等级及以上的所有等级的信息都写到对应的日志文件里
mail.none #表示某事件的信息不写到日志文件里(这里比如是邮件)
2.2 日志消息的级别
级号 | 优先级级别 | 说明 |
---|---|---|
0 | EMERG(紧急) | 会导致主机系统不可用的情况。 |
1 | ALERT(警告) | 必须马上采取措施解决的问题。 |
2 | CRIT(严重) | 比较严重的情况。 |
3 | ERR(错误) | 运行出现错误。 |
4 | WARNING(提醒) | 可能影响系统功能,需要提醒用户的重要事件。 |
5 | NOTICE(注意) | 不会影响正常功能,但是需要注意的事件。 |
6 | INFO(信息) | 一般信息。 |
7 | DEBUG(调试) | 程序或系统调试信息等。 |
#公共日志/var/log/messages 文件的记录格式
时间标签:消息发出的日期和时间。
主机名:生成消息的计算机的名称。
子系统名称:发出消息的应用程序的名称。
消息:消息的具体内容。