Linux操作系统文件系统基础知识详解

Linux操作系统文件系统基础知识详解

Linux文件结构 
  文件结构是文件存放在磁盘等存贮设备上的组织方法。主要体现在对文件目录的组织上。

文件是Linux中的一切,不论是数据库、窗口还是软件,它们都是文件。
  目录提供了管理文件的一个方便而有效的途径。
Linux使用标准的目录结构,在安装的时候,安装程序就已经为用户创建了文件系统完整固定目录组成形式,并指定了每个目录的作用和其中的文件类型。
                  /根目录
                             

┏━━┳━━━┳━━━┳━━━╋━━━┳━━━┳━━━┳━━━┓
                              
bin  home    dev     etc    lib     sbin    tmp     usr    var
                    
                    
                  
┏━┻━┓    ┏━━┳━━┳━━┳━┻━┳━━┓
                  
                  
                rc.d   cron.d X11R6  src  lib   local    man  bin
                  
                    
┏━━━┳━━┳━┻━┳━━━┓      
               
init.d rc0.d  rc1.d  rc2.d …… linux bin lib src
Linux采用的是树型结构。最上层是根目录,其他的所有目录都是从根目录出发而生成的。微软的DOSwindows也是采用树型结构,但是在DOS windows中这样的树型结构的根是磁盘分区的盘符,有几个分区就有几个树型结构,他们之间的关系是并列的。但是在linux,无论操作系统管理几个磁盘分区,这样的目录树只有一个。从结构上讲,各个磁盘分区上的树型目录不一定是并列的。
  如果这样讲不好理解的话,我来举个例子:
  有一块硬盘,分成了4个分区,分别是//boot/usrwindows下的fat
  对于//boot或者//usr,它们是从属关系;对于/boot/usr,它们是并列关系。
  如果我把windows下的fat分区挂载到/mnt/winc下,(挂载??哦,别急,呵呵,一会就讲,一会就讲。)那么对于/mnt/winc/usr/mnt/winc/boot来说,它们是从属于目录树上没有任何关系的两个分支。
  因为linux是一个多用户系统,制定一个固定的目录规划有助于对系统文件和不同的用户文件进行统一管理。但就是这一点让很多从windows转到linux的初学者感到头疼。下面列出了linux下一些主要目录的功用。
/bin二进制可执行命令
/dev设备特殊文件
/etc系统管理和配置文件
/etc/rc.d启动的配置文件和脚本
/home用户主目录的基点,比如用户user的主目录就是/home/user,可以用~user表示
/lib标准程序设计库,又叫动态链接共享库,作用类似windows里的.dll文件
/sbin系统管理命令,这里存放的是系统管理员使用的管理程序
/tmp公用的临时文件存储点
/root系统管理员的主目录(呵呵,特权阶级)
/mnt系统提供这个目录是让用户临时挂载其他的文件系统。
/lost+found这个目录平时是空的,系统非正常关机而留下无家可归的文件(windows下叫什么.chk)就在这里
/proc虚拟的目录,是系统内存的映射。可直接访问这个目录来获取系统信  息。
/var某些大文件的溢出区,比方说各种服务的日志文件
/usr最庞大的目录,要用到的应用程序和文件几乎都在这个目录。其中包  含:
/usr/X11R6存放Xwindow的目录
/usr/bin众多的应用程序
/usr/sbin超级用户的一些管理程序
/usr/doclinux文档
/usr/includelinux下开发和编译应用程序所需要的头文件
/usr/lib常用的动态链接库和软件包的配置文件
/usr/man帮助文档
/usr/src源代码,linux内核的源代码就放在/usr/src/linux
/usr/local/bin本地增加的命令
/usr/local/lib本地增加的库
  linux文件系统
文件系统指文件存在的物理空间,linux系统中每个分区都是一个文件系统,都有自己的目录层次结构。linux会将这些分属不同分区的、单独的文件系统按一定的方式形成一个系统的总的目录层次结构。一个操作系统的运行离不开对文件的操作,因此必然要拥有并维护自己的文件系统。
linux文件系统使用索引节点来记录文件信息,作用像windows的文件分配表。
  索引节点是一个结构,它包含了一个文件的长度、创建及修改时间、权限、所属关系、磁盘中的位置等信息。一个文件系统维护了一个索引节点的数组,每个文件或目录都与索引节点数组中的唯一一个元素对应。系统给每个索引节点分配了一个号码,也就是该节点在数组中的索引号,称为索引节点号。
     linux
文件系统将文件索引节点号和文件名同时保存在目录中。所以,目录只是将文件的名称和它的索引节点号结合在一起的一张表,目录中每一对文件名称和索引节点号称为一个连接。
  对于一个文件来说有唯一的索引节点号与之对应,对于一个索引节点号,却可以有多个文件名与之对应。因此,在磁盘上的同一个文件可以通过不同的路径去访问它。
  可以用ln命令对一个已经存在的文件再建立一个新的连接,而不复制文件的内容。连接有软连接和硬连接之分,软连接又叫符号连接。它们各自的特点是:
  硬连接:原文件名和连接文件名都指向相同的物理地址。目录不能有硬连接;硬连接不能跨越文件系统(不能跨越不同的分区)文件在磁盘中只有一个拷贝,节省硬盘空间;
  由于删除文件要在同一个索引节点属于唯一的连接时才能成功,因此可以防止不必要的误删除。
  符号连接:用ln -s命令建立文件的符号连接符号连接是linux特殊文件的一种,作为一个文件,它的数据是它所连接的文件的路径名。类似windows下的快捷方式。可以删除原有的文件而保存连接文件,没有防止误删除功能。

、挂载文件系统
由上一节知道,linux系统中每个分区都是一个文件系统,都有自己的目录层次结构。linux会将这些分属不同分区的、单独的文件系统按一定的方式形成一个系统的总的目录层次结构。这里所说的按一定方式就是指的挂载。
将一个文件系统的顶层目录挂到另一个文件系统的子目录上,使它们成为一个整体,称为挂载。把该子目录称为挂载点。
举个例子吧:
  根分区:
/根目录

┏━━━━┳━━━━━┳━━━━━┳━━━━━╋━━━━━┳━━━━━┳━━━━━┳━━━━━┓

bin home dev etc lib sbin tmp usr var

┏━┻━┓

rc.d cron.d

┏━━━┳━━━┳━┻━┳━━━━┓

init.d rc0.d rc1.d rc2.d ……
/usr分区
usr

┏━━━━┳━━━╋━━━┳━━━┳━━━┓

X11R6 src lib local man bin

┏━━━╋━━━┓

linux bin lib src
  挂载之后就形成了文章开始时的那个图。像不像挂上去的?
  注意:1、挂载点必须是一个目录。
2、一个分区挂载在一个已存在的目录上,这个目录可以不为空,但挂载后这个目录下以前的内容将不可用。
对于其他操作系统建立的文件系统的挂载也是这样。但是需要理解的是:光盘、软盘、其他操作系统使用的文件系统的格式与linux使用的文件系统格式是不一样的。光盘是ISO9660;软盘是fat16ext2windows NTfat16NTFSwindows98fat16fat32windows2000windowsXPfat16fat32NTFS。挂载前要了解linux是否支持所要挂载的文件系统格式。
  挂载时使用mount命令:
格式:mount[-参数][设备名称][挂载点]
  其中常用的参数有
-t指定设备的文件系统类型,常见的有:
minixlinux最早使用的文件系统
ext2linux目前常用的文件系统
msdosMS-DOSfat,就是fat16
vfatwindows98常用的fat32
nfs网络文件系统
iso9660CD-ROM光盘标准文件系统
ntfswindows NT 2000的文件系统
hpfsOS/2文件系统
auto自动检测文件系统
-o指定挂载文件系统时的选项。有些也可用在/etc/fstab中。常用的  有
codepage=XXX代码页
iocharset=XXX字符集
ro以只读方式挂载
rw以读写方式挂载
nouser使一般用户无法挂载
user可以让一般用户挂载设备
  提醒一下,mount命令没有建立挂载点的功能,因此你应该确保执行mount命令时,挂载点已经存在。(不懂?说白了点就是你要把文件系统挂载到哪,首先要先建上个目录。这样OK?)
  例子:windows98装在hda1分区,同时计算机上还有软盘和光盘需要挂载。
#mk /mnt/winc
#mk /mnt/floppy
#mk /mnt/cdrom
#mount -t vfat /dev/hda1 /mnt/winc
#mount -t msdos /dev/fd0 /mnt/floppy
#mount -t iso9660 /dev/cdrom /mnt/cdrom
  现在就可以进入/mnt/winc等目录读写这些文件系统了。
  要保证最后两行的命令不出错,要确保软驱和光驱里有盘。(要是硬盘的磁盘片也可以经常随时更换的话,我想就不会犯这样的错误了 :->
如果你的windows98目录里有中文文件名,使用上面的命令挂载后,显示的是一堆乱码。这就要用到 -o参数里的codepage iocharset选项。codepage指定文件系统的代码页,简体中文中文代码是936iocharset指定字符集,简体中文一般用cp936 gb2312
  当挂载的文件系统linux不支持时,mount一定报错,如windows2000ntfs文件系统。可以重新编译linux内核以获得对该文件系统的支持。关于重新编译linux内核,就不在这里说了。
  、自动挂载
每次开机访问windows分区都要运行mount命令显然太烦琐,为什么访问其他的linux分区不用使用mount命令呢?
  其实,每次开机时,linux自动将需要挂载的linux分区挂载上了。那么我们是不是可以设定让linux在启动的时候也挂载我们希望挂载的分区,如windows分区,以实现文件系统的自动挂载呢?
  这是完全可以的。在/etc目录下有个fstab文件,它里面列出了linux开机时自动挂载的文件系统的列表。我的/etc/fstab文件如下:
/dev/hda2/ ext3 defaults 1 1
/dev/hda1/boot ext3 defaults 1 2
none/dev/pts devpts gid=5,mode=620 0 0
none/proc proc defaults 0 0
none/dev/shm tmpfs defaults 0 0
/dev/hda3swap swap defaults 0 0
/dev/cdrom/mnt/cdrom iso9660 noauto,codepage=936,iocharset=gb2312 0 0
/dev/fd0/mnt/floppy auto noauto,owner,kudzu 0 0
/dev/hdb1/mnt/winc vfat defaults,codepage=936,iocharset=cp936 0 0
/dev/hda5/mnt/wind vfat defaults,codepage=936,iocharset=cp936 0 0
  在/etc/fstab文件里,第一列是挂载的文件系统的设备名,第二列是挂载点,第三列是挂载的文件系统类型,第四列是挂载的选项,选项间用逗号分隔。第五六列不知道是什么意思,还望高手指点。
  在最后两行是我手工添加的windows下的CD盘,加了codepage=936iocharset=cp936参数以支持中文文件名。参数defaults实际上包含了一组默认参数:
rw以可读写模式挂载
suid开启用户ID和群组ID设置位
dev可解读文件系统上的字符或区块设备
exec可执行二进制文件
auto自动挂载
nouser使一般用户无法挂载
async以非同步方式执行文件系统的输入输出操作
大家可以看到在这个列表里,光驱和软驱是不自动挂载的,参数设置为noauto。(如果你非要设成自动挂载,你要确保每次开机时你的光驱和软驱里都要有盘,呵呵。)

文件系统具有不同的格式,它们决定了信息如何被存储为文件和目录,这些格式被称为文件系统类型。常用的文件系统类型:
    ext2 : 早期linux中常用的文件系统
    ext3 :ext2的升级版,带日志功能
    RAMFS:内存文件系统,速度很快
    NFS : 网络文件系统,由SUN发明,主要用于远程文件共享
   MS-DOS :MS-DOS文件系统
    VFAT :Windows 95/98 操作系统采用的文件系统
    FAT :Windows XP 操作系统采用的文件系统
    NTFS :Windows NT/XP 操作系统采用的文件系统
    HPFS :OS/2 操作系统采用的文件系统
    PROC: 虚拟的进程文件系统
   ISO9660 :大部分光盘所采用的文件系统
   ufsSun : OS 所采用的文件系统
    NCPFS:Novell 服务器所采用的文件系统
    SMBFS:Samba 的共享文件系统
    XFS : 由SGI开发的先进的日志文件系统,支持超大容量文件
    JFS :IBM的AIX使用的日志文件系统
   ReiserFS : 基于平衡树结构的文件系统
    udf: 可擦写的数据光盘文件系统

文件的逻辑结构

    文件的逻辑结构可分为两大类字节流式的无结构文件记录式的有结构文件

    由字节流(字节序列)组成的文件是一种无结构文件或流式文件 ,不考虑文件内部的逻辑结构,只是简单地看作是一系列字节的序列,便于在文件的任意位置添加内容。

由记录组成的文件称为记录式文件 ,记录是这种文件类型的基本信息单位,记录式文件通用于信息管理。

Linux常用文件系统


ext2文件系统

ext2文件系统的数据块大小一般为 1024B、2048B 或 4096B

ext2文件系统采用的索引节点(inode):

索引节点采用了多重索引结构,主要体现在直接指针和3个间接指针直接指针包含12个直接指针块,它们直接指向包含文件数据的数据块,紧接在后面的3个间接指针是为了适应文件的大小变化而设计的。

e.g: 假设数据块大小为1024B ,利用12个直接指针,可以保存最大为12KB的文件,当文件超过12KB时,则要利用单级间接指针,该指针指向的数据块保存有一组数据块指针,这些指针依次指向包含有实际数据的数据块,

假如每个指针占用4B,则每个单级指针数据块可保存1024/4=256个数据指针,因此利用直接指针和单级间接指针可保存 1024*12+1024*256=268KB的文件。当文件超过268KB时,再利用二级间接指针,直到使用三级间接指针

注:一个二级间接指针指向的数据块保存有一组数据块指针,数据块中的每一个指针指向一个单级间接指针;三级的同理,块里每一个指针指向一个二级间接。

利用直接指针单级间接指针二级间接指针三级间接指针可保存的最大文件大小为:

1024*12+1024*256+1024*256*256+1024*256*256*256=16843020KB,约16GB

若数据块大小为2048B,指针占4B,则最大文件大小为: 2048*12+2048*512+2048*512*512+2048*512*512*512=268,960,792KB 约268GB

若数据块大小为4096B,指针占4B,则最大文件大小为: 4096*12+4096*1024+4096*1024*1024+4096*1024*1024*1024=4,299,165,744KB ,约4TB

注:命令tune2fs -l /dev/sda5  可查看文件系统

ext2文件系统最大文件名长度: 255个字符

 

ext2文件系统的缺点

ext2在写入文件内容的同时并没有同时写入文件meta-data,其工作顺序是先写入文件的内容,然后等空闲时候才写入文件的meta-data。若发生意外,则文件系统就会处于不一致状态。

在重新启动系统的时候,linux会启动 fsk ( file system check) 的程序,扫描整个文件系统并试图修复,但不提供保证。

ext3文件系统

ext3基于ext2的代码,所以磁盘格式与ext2相同,使用相同的元数据。

ext2文件系统无损转化为ext3文件系统:  tune2fs -j /dev/sda6

 

日志块设备( Journaling block device layer,JBD)完成ext3文件系统日志功能。JBD不是ext3文件系统所特有的,它的设计目标是为了向一个块设备添加日志功能。

当一个文件修改执行时,ext3文件系统代码将通知JBD,称为一个事务(transaction)。发生意外时,日志功能具有的重放功能,能重新执行中断的事务。

日志中的3种数据模式

1)、data=writeback:不处理任何形式的日志数据,给用户整体上的最高性能

2)、data=odered:只记录元数据日志,但将元数据和数据组成一个单元称为事务(transaction) 。此模式保持所句句的可靠性与文件系统的一致性,性能远低于data=writeback模式,但比data=journal模式快

3)、data=journal:提供完整的数据及元数据日志,所有新数据首先被写入日志,然后才被定位。意外发生过后,日志可以被重放,将数据与元数据带回一致状态。这种模式整体性能最慢,但数据需要从磁盘读取和写入磁盘时却是3种模式中最快的。

ext3文件系统最大文件名长度:255个字符

ext3文件系统的优点:可用性、数据完整性、速度、兼容性

ReiserFS文件系统

ReiserFS文件系统是由HansReiser和他领导的开发小组共同开发的,整个文件系统完全是从头设计的,是一个非常优秀的文件系统。也是最早用于Linux的日志文件系统之一。

ReiserFS的特点

先进的日志机制

ReiserFS有先进的日志(Journaling/logging)功能 机制。日志机制保证了在每个实际数据修改之前,相应的日志已经写入硬盘。文件与数据的安全性有了很大提高。

高效的磁盘空间利用

Reiserfs对一些小文件不分配inode。而是将这些文件打包,存放在同一个磁盘分块中。而其它文件系统则为每个小文件分别放置到一个磁盘分块中。

独特的搜寻方式

ReiserFS基于快速平衡树(balancedtree)搜索,平衡树在性能上非常卓越,这是一种非常高效的算法。ReiserFS搜索大量文件时,搜索速度要比ext2快得多。Reiserfs文件系统使用B*Tree存储文件,而其它文件系统使用B+Tree树。B*Tree查询速度比B+Tree要快很多。Reiserfs在文件定位上速度非常快。

在实际运用中,ReiserFS 在处理小于 4k 的文件时,比ext2 快 5 倍;带尾文件压缩功能(默认)的ReiserFS 比ext2文件系统多存储6%的数据。

支持海量磁盘

ReiserFS是一个非常优秀的文件系统,一直被用在高端UNIX系统上,可轻松管理上百G的文件系统,ReiserFS文件系统最大支持的文件系统尺寸为16TB。这非常适合企业级应用中。

优异的性能

由于它的高效存储和快速小文件I/O特点,使用ReiserFs文件系统的PC,在启动X窗口系统时,所花的时间要比在同一台机器上使用ext2文件系统少1/3。另外,ReiserFS文件系统支持单个文件尺寸为4G的文件,这为大型数据库系统在linux上的应用提供了更好的选择。

参考来源


[01]  http://linux.chinaunix.net/techdoc/beginner/2007/03/30/953684.shtml

[02]  http://linux.chinaunix.net/techdoc/beginner/2007/12/06/973887.shtml

 

 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值