经过搜集和整理有关
linux
文件的材料,在这里本人给大家推荐
linux
文件系统分类,相信大家看后会有不少收获。
1
、
linux
文件系统分配策略
块分配(
blockallocation
)和扩展分配(
extentallocation
):
块分配:磁盘上的文件块根据需要分配给文件,避免了存储空间的浪费。但当文件扩充时,会造成文件中文件块的不连续,从而导致过多的磁盘寻道时间。
每一次文件扩展时,块分配算法就需要写入文件块的结构信息,也就是
meta
-
dada
。
meta
-
data
总是与文件一起写入存储设备,改变文件的操作要等到所有
meta
-
data
的操作都完成后才能进行,因此,
meta
-
data
的操作会明显降低整个文件系统的性能。
扩展分配:文件创建时,一次性分配一连串连续的块,当文件扩展时,也一次分配很多块。
meta
-
data
在文件创建时写入,当文件大小没有超过所有已分配文件块大小时,就不用写入
meta
-
data
,直到需要再分配文件块的时候。
扩展分配采用成组分配块的方式,减少了
SCSI
设备写数据的时间,在读取顺序文件时具有良好的性能,但随机读取文件时,就和块分配类似了。
文件块的组或块簇(
blockcluster
)的大小是在编译时确定的。簇的大小对文件系统的性能有很大的影响。
注:
meta
-
data
元信息:和文件有关的信息,比如权限、所有者以及创建、访问或更改时间等。
2
、文件的记录形式
linux
文家系统使用索引节点(
inode
)来记录文件信息。索引节点是一种数据结构,它包含了一个文件的长度、创建及修改时间、权限、所属关系、磁盘中的位置等信息。
一个文件系统维护了一个索引节点的数组,每个文件或目录都与索引节点数组中的唯一的元素对应。每个索引节点在数组中的索引号,称为索引节点号。
linux
文件系统将文件索引节点号和文件名同时保存在目录中,所以,目录只是将文件的名称和它的索引节点号结合在一起的一张表,目录中每一对文件名称和索引节点号称为一个连接。
对于一个文件来说,有一个索引节点号与之对应;而对于一个索引节点号,却可以对应多个文件名。
连接分为软连接和硬连接,其中软连接又叫符号连接。
硬连接:原文件名和连接文件名都指向相同的物理地址。目录不能有硬连接;硬连接不能跨文件系统(不能跨越不同的分区),文件在磁盘中只有一个拷贝。
由于删除文件要在同一个索引节点属于唯一的连接时才能成功,因此硬连接可以防止不必要的误删除。
软连接:用
ln
-
s
命令建立文件的符号连接。符号连接是
linux
特殊文件的一种,作为一个文件,它的数据是它所连接的文件的路径名。没有防止误删除的功能。
3
、
linux
文件系统分类
ext2
:早期
linux
中常用的文件系统
ext3
:
ext2
的升级版,带日志功能
RAMFS
:内存文件系统,速度很快
NFS
:网络文件系统,由
SUN
发明,主要用于远程文件共享
MS
-
DOS
:
MS
-
DOS
文件系统
VFAT
:
Windows95/98
操作系统采用的文件系统
FAT
:
WindowsXP
操作系统采用的文件系统
NTFS
:
WindowsNT/XP
操作系统采用的文件系统
HPFS
:
OS/2
操作系统采用的文件系统
PROC
:虚拟的进程文件系统
ISO9660
:大部分光盘所采用的文件系统
ufsSun
:
OS
所采用的文件系统
NCPFS
:
Novell
服务器所采用的文件系统
SMBFS
:
Samba
的共享文件系统
XFS
:由
SGI
开发的先进的日志文件系统,支持超大容量文件
JFS
:
IBM
的
AIX
使用的日志文件系统
ReiserFS
:基于平衡树结构的文件系统
udf
:可擦写的数据光盘文件系统
4
、虚拟文件系统
VFS
linux
支持的所有文件系统称为逻辑文件系统,而
linux
在传统的逻辑文件系统的基础上增加料一个蓄念文件系统(
VitualFileSystem
,
VFS
)的接口层。虚拟文件系统(
VFS
)位于文件系统的最上层,管理各种逻辑文件系统,并可以屏蔽各种逻辑文件系统之间的差异,提供统一文件和设备的访问接口。
5
、文件的逻辑结构
文件的逻辑结构可分为两大类:字节流式的无结构文件和记录式的有结构文件。
由字节流(字节序列)组成的文件是一种无结构文件或流式文件,不考虑文件内部的逻辑结构,只是简单地看作是一系列字节的序列,便于在文件的任意位置添加内容。
由记录组成的文件称为记录式文件,记录是这种文件类型的基本信息单位,记录式文件通用于信息管理。
6
、文件类型
普通文件:通常是流式文件
目录文件:用于表示和管理系统中的全部文件
连接文件:用于不同目录下文件的共享
设备文件:包括块设备文件和字符设备文件,块设备文件表示磁盘文件、光盘等,字符设备文件按照字符操作终端、键盘等设备。
管道(
FIFO
)文件:提供进程建通信的一种方式
套接字(
socket
)文件:该文件类型与网络通信有关
7
、文件结构
包括索引节点和数据
索引节点:又称
I
节点,在文件系统结构中,包含有关相应文件的信息的一个记录,这些信息包括文件权限、文件名、文件大小、存放位置、建立日期等。文件系统中所有文件的索引节点保存在索引节点表中。
数据:文件的实际内容。可以是空的,也可以非常大,并且拥有自己的结构。
8
、
ext2
文件系统
ext2
文件系统的数据块大小一般为
1024B
、
2048B
或
4096B
ext2
文件系统采用的索引节点(
inode
):索引节点采用了多重索引结构,主要体现在直接指针和
3
个间接指针。直接指针包含
12
个直接指针块,它们直接指向包含文件数据的数据块,紧接在后面的
3
个间接指针是为了适应文件的大小变化而设计的。
e
.
g
:假设数据块大小为
1024B
,利用
12
个直接指针,可以保存最大为
12KB
的文件,当文件超过
12KB
时,则要利用单级间接指针,该指针指向的数据块保存有一组数据块指针,这些指针依次指向包含有实际数据的数据块,假如每个指针占用
4B
,则每个单级指针数据块可保存
1024/4
=
256
个数据指针,因此利用直接指针和单级间接指针可保存
1024*12
+
1024*256
=
268KB
的文件。
当文件超过
268KB
时,再利用二级间接指针,直到使用三级间接指针。利用直接指针、单级间接指针、二级间接指针、三级间接指针可保存的最大文件大小为:
1024*12
+
1024*256
+
1024*256*256
+
1024*256*256*256
=
16843020KB
,约
16GB
,若数据块大小为
2048B
,指针占
4B
,则最大文件大小为:
2048*12
+
2048*512
+
2048*512*512
+
2048*512*512*512
=
268
,
960
,
792KB
约
268GB
若数据块大小为
4096B
,指针占
4B
,则最大文件大小为:
4096*12
+
4096*1024
+
4096*1024*1024
+
4096*1024*1024*1024
=
4
,
299
,
165
,
744KB
,约
4TB
注:命令
tune2fs
-
l/dev/sda5
可查看文件系统,
ext2
文件系统最大文件名长度:
255
个字符
ext2
文件系统的缺点:
ext2
在写入文件内容的同时并没有同时写入文件
meta
-
data
,其工作顺序是先写入文件的内容,然后等空闲时候才写入文件的
meta
-
data
。若发生意外,则文件系统就会处于不一致状态。在重新启动系统的时候,
linux
会启动
fsk
(
filesystemcheck
)的程序,扫描整个文件系统并试图修复,但不提供保证。
9
、
ext3
文件系统
ext3
基于
ext2
的代码,所以磁盘格式与
ext2
相同,使用相同的元数据。
ext2
文件系统无损转化为
ext3
文件系统:
tune2fs
-
j/dev/sda6
日志块设备(
Journalingblockdevicelayer
,
JBD
)完成
ext3
文件系统日志功能。
JBD
不是
ext3
文件系统所特有的,它的设计目标是为了向一个块设备添加日志功能。当一个文件修改执行时,
ext3
文件系统代码将通知
JBD
,称为一个事务(
transaction
)。发生意外时,日志功能具有的重放功能,能重新执行中断的事务。
日志中的
3
种数据模式:
1
)
data
=
writeback
:不处理任何形式的日志数据,给用户整体上的最高性能
2
)
data
=
odered
:只记录元数据日志,但将元数据和数据组成一个单元称为事务(
transaction
)。此模式保持所句句的可靠性与文件系统的一致性,性能远低于
data
=
writeback
模式,但比
data
=
journal
模式快
3
)
data
=
journal
:提供完整的数据及元数据日志,所有新数据首先被写入日志,然后才被定位。意外发生过后,日志可以被重放,将数据与元数据带回一致状态。这种模式整体性能最慢,但数据需要从磁盘读取和写入磁盘时却是
3
种模式中最快的。
ext3
文件系统最大文件名长度:
255
个字符
ext3
文件系统的优点:可用性、数据完整性、速度、兼容性
10
、
ReiserFS
文件系统
ReiserFS
文件系统是由
HansReiser
和他领导的开发小组共同开发的,整个文件系统完全是从头设计的,是一个非常优秀的文件系统。也是最早用于
Linux
的日志文件系统之一。
ReiserFS
的特点:先进的日志机制
ReiserFS
有先进的日志(
Journaling/logging
)功能机制。日志机制保证了在每个实际数据修改之前,相应的日志已经写入硬盘。文件与数据的安全性有了很大提高。
高效的磁盘空间利用
Reiserfs
对一些小文件不分配
inode
。而是将这些文件打包,存放在同一个磁盘分块中。而其它文件系统则为每个小文件分别放置到一个磁盘分块中。
独特的搜寻方式。
ReiserFS
基于快速平衡树(
balancedtree
)搜索,平衡树在性能上非常卓越,这是一种非常高效的算法。
ReiserFS
搜索大量文件时,搜索速度要比
ext2
快得多。
Reiserfs
文件系统使用
B*Tree
存储文件,而其它文件系统使用
B
+
Tree
树。
B*Tree
查询速度比
B
+
Tree
要快很多。
Reiserfs
在文件定位上速度非常快。在实际运用中,
ReiserFS
在处理小于
4k
的文件时,比
ext2
快
5
倍;带尾文件压缩功能(默认)的
ReiserFS
比
ext2
文件系统多存储
6%
的数据。
支持海量磁盘
ReiserFS
是一个非常优秀的文件系统,一直被用在高端
UNIX
系统上,可轻松管理上百
G
的文件系统,
ReiserFS
文件系统最大支持的文件系统尺寸为
16TB
。这非常适合企业级应用中。
linux
文件系统分类优异的性能:由于它的高效存储和快速小文件
I/O
特点,使用
ReiserFs
文件系统的
PC
,在启动
X
窗口系统时,所花的时间要比在同一台机器上使用
ext2
文件系统少
1/3
。另外,
ReiserFS
文件系统支持单个文件尺寸为
4G
的文件,这为大型数据库系统在
linux
上的应用提供了更好的选择。