一、为应对海量数据,系统架构发生变迁
1. 传统系统架构:Server + SAN
主导厂商:EMC/NetAPP/Oracle/IBM
特点:使用SAN存储(FC),价格昂贵,但速度快,响应时间10ms
应用接口:提供通用POSIX/SQL接口
2. 当前系统架构:IP + Cluster
主导厂商:Google/Amazon
特点:便宜,但速度较慢(可接收), 100ms
应用接口:使用GFS/BigData,不支持POSIX/SQL接口
二、XX分布式文件系统:面向企业计算和存储系统的断代性创新的分布式文件系统
基本架构如下:
----------------------------------------------------------------------------------------------------
NFS/CIFS (Client)
----------------------------------------------------------------------------------------------------
Cloud Gateway(可选) POSIX NODE (Service Layer)
----------------------------------------------------------------------------------------------------
LPM Switch(可选) Ethernet Switch (Distribution Layer)
----------------------------------------------------------------------------------------------------
Local Storage Layer (Storage Layer)
----------------------------------------------------------------------------------------------------
其中,NFS/CIFS是客户端,提供对通过文件访问协议支持。
POSIX NODE:
简称P Node,用来向客户端提供POSIX服务;同时提供Server端的CACHE和WRITE LOG. 主要缓存对FS的写,以批量更新。
同时,为避免P Node失效,会将待写数据备份到别的P Node,等备份节点也写成功后才会向客户端返回。P Node对FS的元数据管理,要借助本地文件系统。
内嵌Dedup引擎,以对数据进行分片和数据去重。
Ethernet Switch:
简称L NODE,是XXFS的卷管理器,负责对P NODE中数据分片的定位。
可以多个L NODE组成一个DHT环,以实现负责均衡。
在C NODE(PAXOS,系统中心控制节点)的控制下,决定了数据存储位置。
Local Storage Layer:
简称O NODE,负责数据的本地存储和保护,实现了DPU/DPG(数据保护单元和数据保护组),它们采用EraseCode来具体实现。