Linux kernel 自 2.6.28 开始正式支持新的文件系统 Ext4。 Ext4 是 Ext3 的改进版,修改了 Ext3 中部分重要的数据结构,而不仅仅像 Ext3 对 Ext2 那样,只是增加了一个日志功能而已。Ext4 可以提供更佳的性能和可靠性,还有更为丰富的功能:

关于linux ext4文件系统特性
(Ext4是内核版本2.6.28的重要部分)

1. 与 Ext3 兼容。 执行若干条命令,就能从 Ext3 在线迁移到 Ext4,而无须重新格式化磁盘或重新安装系统。原有 Ext3 数据结构照样保留,Ext4 作用于新数据,当然,整个文件系统因此也就获得了 Ext4 所支持的更大容量。

2. 更大的文件系统和更大的文件。 较之 Ext3 目前所支持的最大 16TB 文件系统和最大 2TB 文件,Ext4 分别支持 1EB(1,048,576TB, 1EB=1024PB, 1PB=1024TB)的文件系统,以及 16TB 的文件。

3. 无限数量的子目录 Ext3 目前只支持 32,000 个子目录,而 Ext4 支持无限数量的子目录。

4. Extents。 Ext3 采用间接块映射,当操作大文件时,效率极其低下。比如一个 100MB 大小的文件,在 Ext3 中要建立 25,600 个数据块(每个数据块大小为 4KB)的映射表。而 Ext4 引入了现代文件系统中流行的 extents 概念,每个 extent 为一组连续的数据块,上述文件则表示为“该文件数据保存在接下来的 25,600 个数据块中”,提高了不少效率。

5. 多块分配。 当写入数据到 Ext3 文件系统中时,Ext3 的数据块分配器每次只能分配一个 4KB 的块,写一个 100MB 文件就要调用 25,600 次数据块分配器,而 Ext4 的多块分配器“multiblock allocator”(mballoc) 支持一次调用分配多个数据块。


6. 延迟分配。 Ext3 的数据块分配策略是尽快分配,而 Ext4 和其它现代文件操作系统的策略是尽可能地延迟分配,直到文件在 cache 中写完才开始分配数据块并写入磁盘,这样就能优化整个文件的数据块分配,与前两种特性搭配起来可以显著提升性能。

7. 快速 fsck。 以前执行 fsck 第一步就会很慢,因为它要检查所有的 inode,现在 Ext4 给每个组的 inode 表中都添加了一份未使用 inode 的列表,今后 fsck Ext4 文件系统就可以跳过它们而只去检查那些在用的 inode 了。

8. 日志校验。 日志是最常用的部分,也极易导致磁盘硬件故障,而从损坏的日志中恢复数据会导致更多的数据损坏。Ext4 的日志校验功能可以很方便地判断日志数据是否损坏,而且它将 Ext3 的两阶段日志机制合并成一个阶段,在增加安全性的同时提高了性能。

9. “无日志”(No Journaling)模式 日志总归有一些开销,Ext4 允许关闭日志,以便某些有特殊需求用户可以借此提升性能。

10. 在线碎片整理。 尽管延迟分配、多块分配和 extents 能有效减少文件系统碎片,但碎片还是不可避免会产生。Ext4 支持在线碎片整理,并将提供 e4defrag 工具进行个别文件或整个文件系统的碎片整理。

11. inode 相关特性。 Ext4 支持更大的 inode,较之 Ext3 默认的 inode 大小 128 字节,Ext4 为了在 inode 中容纳更多的扩展属性(如纳秒时间戳或 inode 版本),默认 inode 大小为 256 字节。Ext4 还支持快速扩展属性(fast extended attributes)和 inode 保留(inodes reservation)。

12. 持久预分配(Persistent preallocation)。 P2P 软件为了保证下载文件有足够的空间存放,常常会预先创建一个与所下载文件大小相同的空文件,以免未来的数小时或数天之内磁盘空间不足导致下载失败。 Ext4 在文件系统层面实现了持久预分配并提供相应的 API(libc 中的 posix_fallocate()),比应用软件自己实现更有效率。

13. 默认启用 barrier。 磁盘上配有内部缓存,以便重新调整批量数据的写操作顺序,优化写入性能,因此文件系统必须在日志数据写入磁盘之后才能写 commit 记录,若 commit 记录写入在先,而日志有可能损坏,那么就会影响数据完整性。Ext4 默认启用 barrier,只有当 barrier 之前的数据全部写入磁盘,才能写 barrier 之后的数据。(可通过 “mount -o barrier=0″ 命令禁用该特性。)

Ext4 随 Linux kernel 2.6.28 正式发布已有数周,测试所使用的 Linux 内核版本为 2.6.28.2,测试工具为 IOzone 3.318。
IOzone 测试命令为:

  1. time /opt/iozone/bin/iozone -a -s 4G -q 256 -y 4 >|/root/ext4-iozone-stdout.txt
复制代码

上述命令的说明如下:
Auto Mode
File size set to 4194304 KB
Using Maximum Record Size 256 KB
Using Minimum Record Size 4 KB
Command line used: /opt/iozone/bin/iozone -a -s 4G -q 256 -y 4
Output is in Kbytes/sec
Time Resolution = 0.000001 seconds.
Processor cache size set to 1024 Kbytes.
Processor cache line size set to 32 bytes.
File stride size set to 17 * record size.

测试结果除了表明 Ext4 的各方面性能都超过了上一代 Ext3,甚至在大多数情况下,比没有日志功能的 Ext2 还要快出不少:

 

 

 


 
reclenwriterewritereadrereadrandom readrandom writebkwd readrecord rewritestride readfwritefrewritefreadfreread
Ext2

real 28m12.718s
user 0m10.725s
sys 5m8.265s
4218,680216,596630,248245,80288,700138,065106,1121,882,62373,538214,175218,364566,570247,381
8215,308218,690556,064246,260154,680150,052188,3972,462,367130,896217,157216,647583,808248,397
16216,457216,843575,046245,701258,660158,750306,8422,654,320220,939216,061218,140598,174246,581
32217,925214,289537,976243,081394,013167,002464,2402,397,831340,775217,434219,353583,463246,341
64215,460219,256527,919244,362503,227162,917609,5462,546,079456,243216,875217,692571,707244,264
128219,081216,173540,831242,526609,750161,442721,7012,656,729551,122217,780217,427579,271242,291
256216,091217,631565,111245,157654,274173,955870,5472,574,261634,835216,638219,693563,735247,101
Ext3

real 27m42.449s
user 0m11.529s
sys 7m17.049s
4218,242213,039482,132243,98688,007156,926105,5571,540,73975,010216,028216,432522,704243,385
8218,390217,915544,892244,979152,424190,454181,4861,945,603130,737218,364216,431530,853243,222
16218,083217,683561,038244,506255,244200,032300,2122,096,495221,329216,930216,661514,177244,069
32216,258217,013569,246243,811389,745198,275446,4621,934,853338,785216,809219,296530,634243,446
64218,850217,711577,529243,725497,689201,693589,5352,036,412450,449219,387214,900514,353244,809
128220,234215,687530,519241,615608,244199,619714,2951,992,168553,022217,828218,454513,596241,510
256216,011220,188592,578242,548642,341199,408834,2402,092,959624,043217,682218,165529,358242,878
Ext4

real 27m3.485s
user 0m10.847s
sys 6m9.578s
4221,823216,992532,488273,66885,210183,195103,0361,862,81774,781225,841220,620523,799272,848
8226,028218,580561,960272,036154,972216,505178,4822,135,372132,506227,423215,766641,021271,328
16222,241217,746547,548270,895260,899223,895295,2882,095,966223,135226,055216,210621,287273,475
32220,121213,025240,426247,628345,210175,977451,6312,145,351342,236225,796213,427598,331269,759
64223,983214,437308,696551,577754,941225,897523,1302,218,016448,086227,030214,706582,795272,323
128222,576217,816624,636271,293644,500224,997720,4682,308,315582,943225,971217,373552,335274,237
256221,202222,238541,685270,898671,748228,085845,4942,215,381643,715225,411219,166580,066273,342

 

 

 

 

 

如何使用Ext4

目前的Ext4文件系统是第一个稳定版本,整个的开发进度和发布计划都被放缓了,就是为了保证用户可以享受到“和使用Ext3同等级”的稳定。

一个非常重要的事情是,目前还没有Ext4 Grub。更准确的说,就是目前没有grub支持ext4。换句话说,就是你目前的发行版本的grub不支持ext4。目前我们的Grub2正在开发之中,在ubuntu和debian发行版中已经有了grub2的grub-pc软件包了,但是目前官方仍没有宣布正式支持。在Google SoC中也包含了一个开发版本,且发布了相关补丁。你可以试用一下,你自己选择喽。

在你的发行版本的下一个新版本之中,可能会有相关的支持出现。所以安全起见,尽量保持你的/boot目录为Ext3文件系统类型。

警告归警告,转换到Ext4其实是件很容易的事情,如下方法均可:

1 建立一个全新的Ext4文件系统。

这是最简单的方法,你只需要升级你的e2fsprogs到Ext4,并且使用mkfs.ext4命令创建文件系统即可。

2 从Ext3迁移到Ext4。

你需要使用tune2fs命令和fsck命令,并且当前文件系统需要被卸载才可以。运行命令

tune2fs -O extents,uninit_bg,dir_index /dev/yourfilesystem

此后,你务必运行fsck命令,否则Ext4将无法挂载你的新文件系统。在fsck过程中,可能会有一些error需要你的确认。你可以考虑使用 -p选项,来告诉fsck你想要的是“automatic repair”,即fsck -pf /dev/yourfilesystem

3 使用Ext4来挂载一个Ext3文件系统。

你可以使用mount -t ext4 /dev/yourpartition /mnt来将一个Ext3文件系统用Ext4来挂载,但你将享受不到那些需要改变磁盘格式才可以享受得到的特性,比如Extents。你可以享受到的只有 那些不需要改变磁盘格式即可享受得到的特性,比如多块分配、延迟分配等。我们当然不建议您这么做,因为Ext4的优秀特性,您将无法体会….

编译时的一些注意:
关于选项的取舍,一共有这样的几个注意点:


  1. 在“General setup”里,Cpuset Support是给有多于16个CPU的主机使用的,一般无须选择。
  2. 在“Block layer”里,假如没有2TB的硬盘,就去掉Support for Large Block Devices 。但是实际上如果要使用ext4文件系统,这个选项不能回答N。
  3. 在“ Timer frequency ”里,默认是250Hz,最好选择1000Hz以提高GUI响应。经过测试,效果还是不错的,现在我的GUI反应速度和Windows已经差距不大了。
  4. 默认设置里面,没有选上任何Sound的选项,需要自己根据硬件情况把Sound里的驱动选上。
  5. 如果不是很旧很旧的硬件,就可以去掉APM。
  6. 在Processor family里选择对应的CPU的类型,不放心的可以用lshw查看一下。
  7. 如果没有4G内存,把NOHIGHMEM设置为N。

 

在xconfig里面可以查找模块,一般是在找硬件模块的时候很有用。至于其它的细节情况,可以先用lsmod命令查看一下,一一地选择对应的模块。而且,一些内核模块在中国并没有相关的硬件,只需要放心大胆地去掉那些无用的模块。比如说,有了某一个模块,那么就可以把和它并列的模块都去掉。当然,还需要注意选项之间的依赖关系。



用lshw可以查看到某些硬件使用的模块,这样可以更快地选择到自己需要的东西。



如果不是一个kernel的开发者,可以在Kernel Hacking里面把Debug symbol去掉,这样可以大大减小内核的大小。



完成选项的选择后,就可以编译了:


make-kpkg clean
make-kpkg --initrd kernel_p_w_picpath

有关make-kpkg的情况,可以用man make-kpkg查看,内容并不多。

编译完成就是安装。编译好的内核在上一层目录,产生了一个deb包,下面安装一下就好了。

因为make-kpkg是debian的编译工具,所以其它发行版里面不能直接使用,那么过程相对就要复杂一些。大概的是下面的过程:

make bzImage
make modules
make modules_install
make install

更多的信息可以去搜索一下,这里不再赘述。

原文来自http://blogold.chinaunix.net/u/9951/showart_2112529.html