F2FS有什么背景让华为大肆宣扬呢?
F2FS (Flash Friendly File System) 是三星做的一个开源的针对于flash
memory的文件系统,已经被Linux merge到了kernel中,专门为基于 NAND 的存储设备设计的新型开源 flash
文件系统。特别针对NAND 闪存存储介质做了友好设计。F2FS 于2012年12月进入Linux 3.8
内核。目前,F2FS仅支持Linux操作系统。
由三星在NAND闪存上使用,它的特点是相较EXT3/4分区格式,显著提高了4K性能,也就是小文件的读取速度。
【F2FS与SSD的缘分】
针对SSD的各种特性,F2FS文件系统做了一些针对性的优化。
1)采用Log-structured File
System的形式。因为这种形式把整个存储设备当作一个环形log一样顺序的写,这符合SSD顺序写的特性。整个文件系统被分为了以segment为单位的区间,每个segment固定大小为2MB。一个section由多个连续的segment组成,一个zone由多个section组成。默认情况下section和zone的size被设定为一个segment的size,但可以随便改。
align with the zone size
|->
align with the segment size
_________________________________________________________________________
| | | Segment |
Node | Segment |
|
| Superblock | Checkpoint |
Info. | Address |
Summary | Main |
| (SB)
| (CP)
| Table (SIT) | Table (NAT) |
Area (SSA) | |
|____________|_____2______|______N______|______N______|______N_____|__N___|
. .
.
.
.
.
.__________________________________________
|_Segment_|_..._|_Segment_|_..._|_Segment_|
. .
._________._________
|_section_|__...__|_
. .
.________.
|__zone__|
2)解决Wandering Tree Problem。首先定义Wandering Tree
Problem:每一次写操作都要写入一个新的位置,在更新inode存储中,要更新direct
table的指针也需要重写,这个page也要写到新的block中,而上一级的indirect
table因此也需要重写,这样一连串的重写会一直走到树根。同时inode map和checkpoint
block也需要重写。他依然采用了经典的inode,但做了一个Node Address
Table(NAT),这个表是扁平化的,包含了所有node
block的位置,可以认为inode里存储的是逻辑地址,NAT转换为真实的物理地址。
3)Block分配。它将数据和node划分为cold、warm、hot三种类型,共计6种形式。
这些数据被分配在6个log中。他把appended
data当作cold,因为只写一次就好,把更新的data当作warm,因为这到后来需要garbage
collection。这就充分利用了SSD的特性:GC的时候,由于Warm中的data经常需要更新,因此里面包含了大量的invalid
page,这是桌重要找的地方。
4)Garbage Collection
两种策略:Greedy和Cost-benefit。Greedy就找invalid
pages最多的block来当victim,而Cost-benefit算法不但要考虑invalid pages,还要考虑segment
age,以延长SSD读写寿命。
附录:【关于inode】
inode是什么?
理解inode,要从文件储存说起。
文件储存在硬盘上,硬盘的最小存储单位叫做"扇区"(Sector)。每个扇区储存512字节(相当于0.5KB)。
操作系统读取硬盘的时候,不会一个个扇区地读取,这样效率太低,而是一次性连续读取多个扇区,即一次性读取一个"块"(block)。这种由多个扇区组成的"块",是文件存取的最小单位。"块"的大小,最常见的是4KB,即连续八个
sector组成一个 block。
文件数据都储存在"块"中,那么很显然,我们还必须找到一个地方储存文件的元信息,比如文件的创建者、文件的创建日期、文件的大小等等。这种储存文件元信息的区域就叫做inode,中文译名为"索引节点"。
每一个文件都有对应的inode,里面包含了与该文件有关的一些信息。
更多内容,请关注微信公众号:存储随笔,ID:
Memory-logger,