存储技术基础 Ch2
2.1 直连式存储与SCSI
什么是DAS?
一种存储架构,存储设备直接连接到主机(服务器),使用块级协议进行数据访问
主要特点
-
直接连接:通过SATA,SAS或USB直接连接到主机的内部或外部
-
存储设备间独立
-
架构简单,易于部署和管理
-
高性能
-
可扩展性有限:可连接到主机的端口数目有限,可寻址的磁盘数有限,距离限制
-
维护需要下电
-
资源共享性差,容易导致资源孤岛
DAS的类型
内部DAS:存储设备直接安装在主机内部的驱动器槽中
外部DAS:通过外部接口连接到主机
连接选项
ATA SATA:主要用于内部总线
SCSI:并行(内部总线),串行SAS(外部总线)
FC:高速网络技术
ESCON 和 FICON:用于外部主机
SCSI
一种用于连接计算机和外围设备的标准接口,并行接口
演变
SCSI-1:8位并行传输,传输速率为5MB/s
SCSI-2:定义通用指令集CSS,提供了增强功能,如Fast SCSI 和 Wide SCSI,分别将数据传输速率提高到 10 MB/s 和 20 MB/s
SCSI-3:包含多种改进版本,如Ultra SCSI、Ultra2 SCSI 和 Ultra3 SCSI,数据传输速率分别提高到 20 MB/s、40 MB/s 和 80 MB/s。
SCSI-3 架构
应用层:定义了多种命令集,支持不同类型的设备和应用
协议层:SCSI-3、FCP、SAS、iSCSI
物理层:SCSI-3并行接口,IEEE串行总线,光纤通道,以太网
SCSI设备组成
-
Initiator:发起I/O请求的设备,负责发送SCSI命令到目标设备,并处理返回的数据或状态信息
-
Target:接收并执行SCSI命令的设备,通常是存储设备
- 目标设备包含一个或多个LU
-
LU:逻辑单元,目标设备中的子设备,每个LU都有唯一LUN
- LU提供具体的存储服务,执行具体的I/O操作
-
SCSI Bus:连接发起者和目标设备的通信路径,可以是并行总线(传统 SCSI)或串行总线(如 SAS 或 iSCSI)。
CDB(Command Descriptor Block):SCSI协议中用来传递命令的基本数据结构
CDB 具有固定长度(8 bit)和标准化结构,包含操作码和参数字段,定义了需要执行的操作及其相关参数
SCSI Ports
发起者端口(Initiator Port):
-
位于发起者设备上,通常是计算机或服务器。
-
用于发送 SCSI 命令和接收来自目标设备的响应。
目标设备端口(Target Port):
-
位于目标设备上,通常是存储设备,如硬盘驱动器、磁带机等。
-
用于接收 SCSI 命令并发送响应和数据。
双向通信端口:
- SCSI 端口支持双向通信,发起者可以发送命令和数据到目标设备,目标设备也可以返回数据和状态信息。
SCSI寻址:总线号,目标设备号,逻辑单元号
SAS
SCSI总线的串行标准,兼容SATA硬盘,采用点对点结构,支持全双工
SAS端口:
-
宽端口:由多个物理链路(Phy)组成,提供更高的带宽和冗余。
-
窄端口:只有一个物理链路(Phy),用于简单的点对点连接,支持多个窄端口捆绑形成宽端口。
SAS 链路(Phy):
-
基本的物理连接单元,每个链路包含一个发送器和一个接收器。
-
每个链路支持独立的双向数据传输。
协议层:
-
SMP(Serial Management Protocol):用于管理和配置 SAS 设备和拓扑结构。
-
STP(Serial Tunneling Protocol):用于在 SAS 和 SATA 设备之间传输命令,提供兼容性支持。
-
SSP(Serial SCSI Protocol):用于在 SAS 设备之间传输 SCSI 命令和数据。
SAS 扩展器(Expander):
-
类似于网络交换机的设备,用于连接多个 SAS 设备,扩展系统的连接能力。
-
支持多个发起者和目标设备之间的高效通信。
SAS 拓扑结构
-
点对点连接:
-
最简单的连接方式,一个发起者直接连接一个目标设备。
-
提供专用的高速通道,适用于高性能需求。
-
-
菊花链连接:
-
一个发起者依次连接多个目标设备,形成链状拓扑。
-
简化布线,但每个链路的设备数量有限。
-
-
星型拓扑:
-
通过 SAS 扩展器实现,多个发起者和目标设备通过扩展器相互连接。
-
提供更高的扩展性和冗余性,适用于大型存储系统。
-
2.2 SAN
什么是SAN?
存储区域网络是一种专用的高性能网络,用于连接存储设备和服务器
-
提供块级数据访问
-
资源整合,集中化存储管理
-
高扩展性:通过使用SAN交换机和光纤通道扩展器实现大规模存储
-
高可用性和可靠性:支持冗余,多路径,镜像和快照,支持RAID,克隆
Fibre Channel 光纤通道
高速网络技术
演化
单服务器,单FC hub,单磁盘阵列,环形仲裁
FC交换机,互连的交换结构
SAN的组件
节点端口(N-port)
可用于:主机中的HBA
存储中的前端适配器
每个端口都有 Tx 和 Rx 链路
布线(Cabling)
铜缆-短距离,后端连接
光纤电缆-长距离,前端连接
两种类型:
单模:可承载单光束,可达10km
多模:同时承载多束光,距离可达500m
光纤连接器:
SC双工连接器,LC双工连接器
ST单工连接器
互连设备
FC Hub:
-
工作在 FC-AL(光纤通道仲裁环)模式。
-
适用于小规模和简单网络。
-
较低成本和复杂度。
-
每个设备共享环的带宽,可能出现性能瓶颈。
FC Switch(光纤通道交换机):
-
工作在 FC-SW(光纤通道交换结构)模式。
-
适用于大规模和复杂网络。
-
更高成本和复杂度。
-
提供每个设备之间的专用连接,带宽不共享,性能更高。
FC Director(光纤通道总控交换机):
-
高端交换能力,高端口密度,支持数百个光纤通道,高带宽
-
高可用性和冗余设计,热插拔
-
模块化架构,扩展性高
-
提供Web管理界面,CLI和API,实现高级管理和实时监控
-
安全访问控制,加密和认证
SAN 互连选项
点对点:设备之间直接连接
FC-AL光纤通道仲裁环:
环形拓扑:
-
FC-AL 采用环形拓扑结构,将所有设备(节点)连接成一个环。
-
数据在环上顺时针或逆时针方向传输,所有设备共享同一条环路。
仲裁机制:
-
仲裁机制确保在任何给定时刻,只有一个设备可以发送数据,防止数据冲突。
-
每个设备通过仲裁过程获得访问环的权限。
设备数量:
- FC-AL 可以连接最多 126 个设备(节点),加上两个环管理器(通常为主机总线适配器(HBA)或交换机端口),总共最多支持 128 个设备。
热插拔:
- 支持设备的热插拔操作,允许在环不中断的情况下添加或移除设备。
兼容性:
- 兼容多种设备类型,包括磁盘阵列、磁带库和主机系统。
FC-SW(Fibre Channel Switched Fabric)
通过交换机(Switch)连接多个设备(主机和存储),形成一个高性能、可扩展的网络环境。与传统的 FC-AL(Fibre Channel Arbitrated Loop)相比,FC-SW 提供了更高的性能、扩展性和可靠性。
交换结构:
-
使用光纤通道交换机将设备连接在一起,每个设备通过专用链路连接到交换机。
-
交换机负责数据帧的路由和转发,确保数据高效传输。
高带宽和低延迟:
-
每个设备都有自己的专用链路,不需要与其他设备共享带宽,提供高带宽和低延迟的通信。
-
交换结构避免了仲裁过程,提高了网络性能。
扩展性:
-
可以通过增加交换机和端口来扩展网络,支持大规模网络的构建。
-
交换机之间可以互连,形成更大的交换结构,称为 SAN Fabrics。
高可靠性:
-
支持多路径连接和冗余配置,避免单点故障。
-
交换机提供了故障隔离和快速故障恢复能力。
管理和安全:
-
交换机支持多种管理协议和工具,如 SNMP、Web 管理界面等,便于监控和管理。
-
提供了基于角色的访问控制和数据加密等安全特性。
光纤通道端口类型(详细分类)
-
N_Port(Node Port):
- 连接主机或存储设备到光纤通道交换机。
-
F_Port(Fabric Port):
- 交换机端口,连接到 N_Port。
-
E_Port(Expansion Port):
- 用于连接两个光纤通道交换机,扩展 SAN。
-
G_Port(Generic Port):
- 通用端口,可以配置为 E_Port 或 F_Port。
-
L_Port(Loop Port):
- 用于光纤通道仲裁环拓扑中的端口,可以是 NL_Port(Node Loop Port)或 FL_Port(Fabric Loop Port)
Inter Switch Links (ISL)
ISL使用E-port将两台或多台FC Switch相互连接
用于传输主机到存储的数据以及从一台交换机到另一台交换机的结构管理流量
也是 SAN 连接中的扩展机制之一
交换网络中的登录类型
登录类型通常指的是设备在网络中进行身份验证和注册的方式
FLOGI(Fabric Login):
-
N_Port 到 F_Port 之间
-
在光纤通道(FC)交换网络中,设备(如主机或存储)向交换机发送 FLOGI 命令,以获取唯一的光纤通道地址(FCID)并注册到交换网络中。FLOGI 是建立光纤通道连接的第一步。
PLOGI(Port Login):
-
N_Port 到 N_Port 之间
-
Port Login 是指设备在完成 Fabric Login 后,与特定的目标设备建立连接并进行身份验证的过程。
-
在 Port Login 过程中,设备向目标设备发送登录请求,目标设备响应并进行身份验证,最终建立到目标设备的逻辑连接。
-
Port Login 用于设备之间建立点对点的连接,如主机与存储设备之间的连接。
PRLI:
-
N_Port 到 N_Port 之间
-
与特定的进程或服务建立连接并进行身份验证的过程。Process Login 通常用于主机与存储设备之间建立逻辑连接,并向存储设备发送 SCSI 命令进行数据访问。
FC 架构
通道技术,低协议开销高性能
FCP:一种 SCSI-3 协议 基于FC 传输
Fibre Channel 协议堆栈包括五个层次,从物理层到协议层,类似于 OSI 模型。
-
FC-4:
-
功能协议层
-
定义高层协议如SCSI,IP如何映射到光纤通道传输,在FCP中,FC-4层定义了SCSI命令如何通过光纤通道传输
-
-
FC-3:
-
公用服务层
-
提供如多播、多点输出,在实际应用中不常使用(也可以说没有实现)
-
-
FC-2
-
帧传输层
-
定义了数据帧的格式和传输机制,包括帧结构、地址映射、交换和路径选择、流量控制等
-
在FCP帧协议中,定义了如何在光纤通道中封装和传输数据
-
-
FC-1
-
编码/解码层
-
负责数据8b/10b编码和解码
-
-
FC-0
-
物理层
-
定义了光纤通道的物理接口,包括光纤介质、连接器、信号类型和传输速度等
-
光纤通道寻址
一种分层的寻址机制来管理和路由数据帧
WWN:一种 64 位的唯一标识符,用于标识网络中的设备,类似MAC地址
WWNN(World Wide Node Name): 标识一个节点(设备),如服务器或存储阵列。
WWPN(World Wide Port Name): 标识节点上的一个端口。
FCID:一种 24 位的地址,用于在光纤通道网络中标识设备
FCID 的格式如下:
-
域 ID(Domain ID): 8 位,用于标识交换网络中的一个交换机域。
-
区域 ID(Area ID): 8 位,用于标识交换机域中的一个交换机或端口组。
-
端口 ID(Port ID): 8 位,用于标识交换机中的具体端口或仲裁环物理地址AL_PA。
数据传输
-
设备登录和注册:
-
设备通过 FLOGI 向交换机发送登录请求,交换机为其分配 FCID。
-
设备通过 PLOGI(Port Login)向目标设备发送登录请求,建立端到端连接。
-
设备通过 PRLI(Process Login)向目标服务或进程发送请求,建立逻辑连接。
-
-
路由
-
数据帧在交换网络中传输时,交换机会根据目标 FCID 路由数据帧。
-
交换机使用 WWN 到 FCID 的映射表查找目标设备的 FCID,并将数据帧转发到相应的端口。
-
-
状态变化通知
- 当网络中的设备状态发生变化时,交换机会发送 RSCN(Registered State Change Notification)通知其他设备,更新其地址信息。
FC数据帧
帧(Frame)
帧头(Frame Header): 包含目标地址、源地址、帧类型、序列 ID、交换 ID 等信息,用于控制帧的传输和路由。
有效载荷(Payload): 携带实际的数据,可以是 SCSI 命令、数据块或控制信息。每个帧的有效载荷最多为 2112 字节。
帧校验序列(Frame Check Sequence, FCS): 用于检测和纠正传输错误。
帧定界符(Frame Delimiters): SOF(Start of Frame)和 EOF(End of Frame),标识帧的开始和结束。
序列(Sequence)
序列是一组有序的帧,用于传输相关联的操作(如一次 SCSI 命令的传输)。序列中的每个帧都有一个序列 ID 和帧号,以确保顺序传输和重组。
交换(Exchange)
交换是指在两个通信节点之间传输的完整操作或事务,它可能包括一个或多个序列。例如,一个完整的读或写操作通常由多个序列组成,包括命令序列、数据序列和确认序列
Core-Edge Fabric 拓扑
一种两层架构的网络设计,其中包括核心层(Core Layer)和边缘层(Edge Layer)。这种结构旨在优化网络性能、扩展性和管理。
1. 核心层(Core Layer)
-
FC Director(光纤通道总控交换机): 核心层由少数高性能、高容量的核心交换机构成,这些交换机负责在整个网络中传输大量的数据流。
-
功能: 核心层的主要功能是提供高速的跨域数据传输,连接多个边缘交换机,并确保最小的延迟和高吞吐量。
2. 边缘层(Edge Layer)
-
FC Switch: 边缘层由多个边缘交换机构成,这些交换机连接到服务器(主机)和存储设备。
-
功能: 边缘层的主要功能是将服务器连接到核心交换机,处理局部数据流量,并将数据传输到核心层以便进一步分发。
Mesh 拓扑
一种全互联(Full Mesh)或部分互联(Partial Mesh)的网络架构。在这种结构中,交换机之间有多个连接路径,可以提供高度的冗余和容错能力。
全互联 Mesh(Full Mesh)
-
定义: 在全互联 Mesh 拓扑中,每个交换机都直接连接到网络中的每个其他交换机。
-
优点:
-
高冗余性: 任意一个交换机或连接的故障不会导致网络中断,其他路径仍然可以传输数据。
-
高带宽: 多条并行路径可以提供更高的总带宽。
-
低延迟: 数据可以直接传输到目的地而无需经过中间节点,减少了延迟。
-
-
缺点:
-
高成本: 需要大量的连接和端口,硬件成本高。
-
复杂性: 配置和管理较为复杂,尤其是在大规模网络中。
-
部分互联 Mesh(Partial Mesh)
-
定义: 在部分互联 Mesh 拓扑中,交换机之间并不是每个都直接连接,而是通过选择性连接形成一个部分互联的网络。
-
优点:
-
成本效益: 相对于全互联 Mesh,减少了连接和端口数量,降低了成本。
-
适度冗余: 提供了一定程度的冗余和容错能力。
-
较低复杂性: 管理和配置相对简单。
-
-
缺点:
- 降低的冗余性和带宽: 不如全互联 Mesh 那样高的冗余和带宽。
Zoning
在光纤通道网络中对设备进行逻辑分区,以控制哪些主机可以访问哪些存储设备(存储端口)。Zoning 通过限制设备之间的通信路径来增强网络的安全性和性能。
Zoning类型:
-
硬Zoning:
- 基于端口:每个Zone通过交换机的端口号定义
-
软Zoning:
- 基于WWN的Zoning:使用设备的WWN来定义Zone
Zoning的配置:
-
单Zone配置:
- 一个Zone包含所有互相通信的设备
-
多Zone配置:
- 将网络划分为多个Zone,每个Zone包含不同的设备集合
2.3 NAS
文件共享环境
文件共享
-
通过网络存储和访问数据文件
-
安装文件共享访问文件
传统的C/S模型,通过文件共享协议实现远程文件共享
-
FTP(文件传输协议)
-
NFC(for Unix Linux)
-
SMB/CIFS(for Windows)
DFS(分布式文件系统)是文件共享实现的另一个示例
什么是NAS?
网络附加存储(Network Attached Storage,NAS)是一种专用设备,提供文件级存储服务,通过标准网络协议(如 NFS、SMB/CIFS)将存储资源共享给网络中的多个客户端。
NAS的优点
-
易于部署和管理:网络接口即可接入现有网络
-
集中存储:集中管理和存储数据
-
数据共享:提供跨平台的文件共享
-
数据安全:提供 RAID 支持、用户权限管理和数据备份功能,增强数据安全性
-
高可用性:提供冗余电源、热插拔硬盘等高可用性特性,确保存储系统的可靠性
NAS的组件
NAS head 是指在网络附加存储(NAS)系统中,负责文件存储、管理和网络连接的控制器或服务器
-
网络接口
-
网络共享协议
-
NAS操作系统
-
存储接口
NAS文件共享协议
NDMP:网络数据管理协议
一种专门用于在网络中备份和恢复数据的协议。
NDMP 工作时通常涉及三个主要组件:数据服务器、NDMP 服务器和备份服务器。
NDMP主要有两种组网,一个是2-way组网,另一个是3-way组网。
2-way组网方式:本地备份场景。备份服务器通过LAN发送备份指令,指示存储系统将数据直接备份到与其相连的磁带库上,不通过LAN发送备份数据。
-
数据服务器和备份设备在同一个系统上。
-
备份数据直接从数据服务器传输到备份设备,不经过网络传输
3-way组网方式:备份服务器通过LAN发送备份指令,指示存储系统将数据备份到与备份服务器相连的磁带库上。
-
数据服务器、NDMP 服务器和备份设备在不同的系统上。
-
数据从数据服务器通过 NDMP 服务器传输到备份设备。
NFS:分布式文件系统协议
使用C/S架构,服务器程序向其他计算机提供对文件系统的访问,客户端程序对共享文件系统进行访问。
NFS 的架构主要包括以下几个部分:
-
NFS 客户端: 运行在需要访问远程文件系统的计算机上,负责向 NFS 服务器发送请求。
-
NFS 服务器: 提供文件系统访问服务,处理来自客户端的请求。
-
传输协议: NFS 通常使用 TCP 或 UDP 作为底层传输协议。TCP 提供更高的可靠性,而 UDP 在某些情况下可以提供更好的性能。
NFS 通过远程过程调用(RPC)机制工作,客户端通过发送 RPC 请求访问远程服务器上的文件系统。以下是 NFS 的工作流程:
-
挂载(Mount): 客户端使用
mount
命令将远程 NFS 服务器上的文件系统挂载到本地文件系统树中。 -
文件操作: 客户端对挂载点上的文件进行常规文件操作(如读、写、创建、删除等),这些操作通过 NFS 协议转换为 RPC 请求。
-
服务器响应: NFS 服务器接收并处理这些请求,返回相应的结果给客户端。
CIFS:传统 Microsoft 环境文件共享协议,基于服务器消息块协议
SMB(服务器消息块)协议增强版
CIFS 协议通过 TCP/IP 网络工作,使用客户端-服务器模型进行通信。
工作流程:
-
会话建立: 客户端与服务器建立一个会话,进行用户认证和授权。
-
资源发现: 客户端浏览网络,发现可用的共享资源(如文件夹和打印机)。
-
文件操作: 客户端通过 CIFS 协议发送请求,对共享资源进行操作(如打开、读取、写入、关闭文件等)。
-
会话终止: 操作完成后,客户端终止会话,释放资源。
NAS的连接
Gateway NAS Connectivity(网关NAS连接)是指通过一个专用网关设备,将现有的存储系统(通常是SAN,存储区域网络)连接到网络附加存储(NAS)环境,使得块级存储可以通过文件级协议(如NFS和CIFS/SMB)进行访问。
Integrated NAS Connectivity(集成式NAS连接)通常指的是将NAS(网络附加存储)功能集成到其他设备或系统中的能力。
服务器集成
网络存储路由器集成
虚拟化平台集成
在NAS上托管和访问文件
步骤
-
创建卷
-
分配卷给NAS设备
-
在卷上创建文件系统
-
挂载文件系统,NTFS等
-
访问文件系统,通过文件共享协议
管理 NAS 环境
管理集成系统
– NAS 组件和存储阵列均通过 NAS 管理软件进行管理
管理网关系统
– NAS 组件通过 NAS 管理软件进行管理
– 存储阵列通过阵列管理软件进行管理
EMC Celerra
一个用于文件及I/O的专用高性能基础架构,包括
数据移动器,控制站,专用OS(DART)
2.4 IP-SAN
IP SAN互联驱动程序
数据块级数据的FC内SAN传输通过光纤通道进行
新兴技术提供了通过现有IP网络基础设施传输块级数据
将IP定位为存储传输,因为:
- 更易于管理
- 可以利用现有的网络基础设施
- 与新的SAN硬件和软件相比降低了成本
- 支持多供应商互操作性
- 许多远程灾难恢复解决方案已经利用了基于IP的网络
- 许多强大而成熟的安全选项可用于IP网络
IP上的块存储–协议选项
-
iSCSI:SCSI over IP,用于连接服务器
IP 封装:以太网网卡/iSCSI HBA
基于硬件的光纤网关,通道存储 -
FCIP
光纤通道到IP的桥接(点对点,光纤通道重点)
用于灾难恢复
不同协议的网络协议栈
iSCSI
概念
– 用于连接主机和存储的基于IP的协议
– 通过基于IP的网络承载块级数据
– 封装SCSI命令并将其传输为TCP/IP数据包
组件
-
iSCSI主启动机器
– 使用NIC或iSCSI HBA连接到存储的主机
– 可能需要安装iSCSI启动器软件 -
iSCSI目标
– 具有嵌入式iSCSI网络端口的存储阵列
– FC iSCSI网桥 -
用于IP存储网络的局域网
–互连以太网交换机和/或路由器
主机连接选项
- 软件启动器: 可以加载到主机上的代码,以提供存储I/O调用和网络接口
- TCP卸载引擎(TOE):将TCP处理负载从主机CPU移到NIC卡上,为应用程序执行释放处理周期
- iSCSI HBA:带有集成SCSI ASIC(专用集成电路)的网络接口适配器,是从SAN启动的最简单选项
协议栈
iSCSI拓扑
本地iSCSI连接
- 无FC组件
- 阵列上的每个iSCSI端口都配置了一个IP地址和端口号→iSCSI启动器直接连接到阵列
桥接iSCSI连接
- 桥接设备将iSCSI/IP转换为FCP
– 独立设备
– 集成到FC交换机(多协议路由器) - 将网桥配置为目标的iSCSI启动器/主机
- 桥接生成虚拟FC启动器
将FCP和本地iSCSI连接相结合
- 阵列以本机方式提供FC和iSCSI连接
- 无需桥接设备
Internet存储名称服务器
对于iSCSI通信,启动器必须发现目标在网络上的位置
-
SendTargets发现:条件是启动器是用目标手动配置的
-
Internet存储名称服务(iSNS)(C-S模型)
启动器和目标自动向iSNS服务器注册
iSNS服务器可以托管在具有指定IP地址的目标、启动器或独立服务器上
名称
所有启动器和目标都需要一个唯一的iSCSI标识符
两种类型: iqn(iSCSI限定名称)/eui(扩展的唯一标识符)
iSCSI错误处理和安全性
-
Level 0
如果SCSI会话损坏,则需要关闭所有TCP连接
通过重复登录重新启动会话 -
Level1
每个节点都有选择地恢复损坏的数据包
在SCSI任务级别执行错误识别和数据恢复
尝试重复传输丢失或损坏的数据包 -
Level2
打开新的TCP连接以替换出现故障的连接
新连接在旧连接出现故障的地方恢复
FCIP(Fiber Channel over IP)
概念
- 一种基于IP的存储网络技术
- 融合了光纤通道和IP的优势
- 创建虚拟FC链路,用于连接不同结构中的设备
- 一种远距离扩展解决方案:用于通过地理位置分散的SAN进行数据共享
FCIP帧
- 将FC帧封装在IP数据包中
–FCIP路由器用于封装
–另一端的FC路由器移除IP包装并将FC数据发送到其他设备 - 包括安全性、数据完整性、拥塞和性能规范
FCoE
概念
- 以本机方式映射光纤通道协议
- 基于FCoE标准和增强型以太网标准(Enhanced Ethernet standard)
- 支持将SAN流量和以太网流量整合到一个通用的万兆网络基础架构上
优点
- 降低支出(适配器,交换机端口,电缆)
- 降低电源和冷却需求
- 可以整合网络基础设施
- 降低总体拥有成本(TCO)
FCoE-物理元素
-
主机接口:CNA(聚合网络适配器)
– 主机上的PCIe卡整合NIC和HBA
– 提供承载综合流量的万兆以太网链路
-
10 Gbps连接选项:主机到FCoE的交换机
无损以太网
- 无因拥塞或缓冲区溢出而导致的帧丢失
– 光纤通道通过链路级别、基于信用的流量控制来管理拥塞
– 以太网使用非无损的分流控制方法 - 以太网的PAUSE功能用于实现无损结构
2.5 Content-Addressed Storage
CAS概述
什么是内容寻址存储(CAS)
- 用于固定内容的解决方案(固定内容:保留数字资产以供积极参考和价值,例如:电子文档,数字记录,富媒体)
- 面向对象、与位置无关的数据存储方法
- “对象”的存储库
- 与存储库接口的访问机制
- 全局唯一标识符提供对对象的访问
存储固定内容的挑战
- 数据增长速度快
- 需要长期保存
- 多用户同时在线访问比离线存储更可取
- 需要更快地访问固定内容
- 需要独立于位置的数据,实现技术更新和迁移
- 传统的储存方法不能满足需求
通过归档的传统存储解决方案
-
三类归档解决方案是:在线/近线/离线
-
传统存档解决方案是离线的
使用光盘和磁带作为归档介质
归档文件通常存储在一次写入多次读取(WORM)设备上,如CD-ROM
传统归档解决方案的不足
- 磁带速度很慢,而且标准总是在变化
- 光纤价格昂贵,需要大量介质
- 从磁带和光盘恢复文件通常很耗时
- 磁带和光盘上的数据可能会出现介质退化
- 这两种解决方案都需要复杂的介质管理
CAS的优势
- 内容真实性
- 内容完整性
- 位置独立性
- 单实例存储(SiS)
- 保留强制执行
- 记录级保护和处置
- 技术独立性
- 快速记录检索
CAS体系结构
CAS物理要素
- 存储设备(基于CAS)
- 服务器(存储设备连接到的服务器)
- 客户端
CAS术语
- API:用于与CAS系统进行交互的接口, 可以用于存储,访问,管理和操作CAS对象
- Access Profile:用于管理和配置访问权限, 它定义了用户或应⽤程序对CAS对象的访问级别、权限和操作限制,以确保数据安全性和合规性。
- Virtual Pool:“虚拟池” 是指用于管理和组织存储资源的逻辑概念。虚拟池是由CAS系统创建和维护的⼀个抽象层,它将物理存储设备(如硬盘、固态驱动器等)中的存储空间划分为逻辑单元。虚拟池允许管理员根据需求和策略创建多个存储池,并为不同类型的数据或应⽤程序分配不同的存储资源。这样可以实现资源隔离、性能优化和灵活的数据管理。
- BLOB (Binary large object):Blob是⼀种数据类型,用于存储⼆进制大型对象,例如图像、音频、视频等。每个Blob都有唯一的标识符。
- Content Address (CA):CAS中的内容地址,⽤于唯⼀标识CAS对象。通过对对象内容应用哈希算法成生的固定长度值,用于快速定位和检索对象。
CAS如何存储数据对象
- 客户端将数据提交给API存档
- 计算唯一内容地址
- 通过IP上的CAS API将对象发送到CAS
- CAS验证内容地址并存储对象
- 申请回复确认
- Object-ID被保留并存储以备将来使用
CAS如何检索数据对象
- 应用程序需要某个对象
- 应用程序查找要检索的对象的内容地址
- 检索请求通过IP上的CAS API发送到CAS
- CAS对请求进行身份验证并交付对象
CAS功能
- 完整性检查
- 数据保护:本地复制/远程复制
- 负载平衡
- 可扩展性
- 自我诊断和修复
- 报告生成和事件通知
- 容错
- 审计跟踪
EMC Centera
- Centera体系结构
–基于RAIN(独立节点冗余阵列)
访问节点
存储节点
2.6 存储虚拟化
虚拟化概述
什么是虚拟化
- 虚拟化是一种将物理资源抽象到逻辑视图中的技术
- 提高IT资源的利用率和能力
- 通过集中和共享资源简化资源管理
- 显著减少停机时间
- 提高了IT资源的性能
虚拟化的形式
- 虚拟内存
- 虚拟网络
- 虚拟服务器
- 虚拟存储
内存虚拟化
- 概念: 每个应用程序都有自己的逻辑内存,独立于物理内存
- 优点:
- 取消物理内存限制
- 同时运行多个应用程序
虚拟网络
- 概念: 每个应用程序都有自己的逻辑网络,独立于物理网络
- 优点:
- 具有单独链路的访问控制特性的通用网络链路
- 管理逻辑网络,而不是物理网络
- 虚拟SAN为存储区域网络提供了类似的好处
服务器虚拟化
- 虚拟化前
- 软件和硬件紧密耦合
- 在同一台机器上运行多个应用程序经常会产生冲突
- 虚拟化后
- 虚拟机(vm)打破了操作系统和硬件之间的依赖关系
- 通过将操作系统和应用程序封装到虚拟机中,将它们作为一个单元进行管理
- 有较强的故障和安全隔离
- 独立于硬件
存储虚拟化
- 向主机提供物理存储资源的逻辑视图的过程
逻辑存储的外观和行为与直接连接到主机的物理存储相同 - 实例:基于主机的卷管理/LUN创建/磁带虚拟化
- 好处:
- 提高了存储利用率
- 在不影响应用程序可用性的情况下添加或删除存储
- 无中断数据迁移
存储虚拟化的实现
SNIA存储虚拟化分类
存储虚拟化需要多个级别
- 服务器:路径管理/卷管理/复制
- 存储网络:路径重定向/负载均衡/访问控制
- 存储硬件:卷管理/访问控制/复制/RAID
存储虚拟化配置
存储虚拟化挑战
- 可扩展性
– 确保存储设备执行适当的要求 - 功能
– 虚拟化环境必须提供相同或更好的功能
– 必须继续利用阵列上的现有功能 - 可管理性
– 虚拟化设备打破了存储基础架构的端到端视图
– 必须集成现有的管理工具 - 支持
– 多供应商环境中的互操作性
块级存储虚拟化
- 将多个独立的存储阵列连接在一起
–作为单个存储设备提供给主机
–用于将此设备上的I/O重定向到底层物理阵列的映射 - 在SAN环境中部署
- 无中断的数据移动和数据迁移
- 实现显著的成本和资源优化
文件级虚拟化
-
虚拟化前
每个NAS设备在物理和逻辑上都是一个独立的实体
未充分利用的存储资源
数据迁移导致的停机时间 -
虚拟化后
打破最终用户访问和数据位置之间的依赖关系
优化了存储利用率
无中断迁移