个人看书学习心得及日常复习思考记录,个人随笔。
物理存储的类型
物理存储的类型主要有:块存储、文件存储、对象存储、表格存储…
- 块存储
本质:直接将磁盘空间通过各种方式提供给主机
缺点:可扩展性及管理性较差
优点:读写效率好,延迟低 - 文件级存储
本质:在硬件存储上建立文件系统,然后直接将文件提供给主机
缺点:读写效率低,延迟大
优点:扩展性好、易于管理,价格便宜
块存储和文件存储(文件存储可以直接进行文件读写,块存储需要进行文件系统格式化后才可以进行文件读写)
- 对象存储
本质:文件存储和对象存储都是用来存储非结构化数据的(图片、视频、音频等),两者最大的不同是数据保管的方式不同。
文件系统是以目录树的形式存放文件的,对象存储没有目录结构,存储在对象存储的文件都称为对象,所有对象都放在一个“桶”中(存储空间),是一种非常扁平化的存储方式。- 对象存储中每个对象都有由三个部分组成
ID:对象的身份标识,唯一的
Data:真实的数据
Metadata:元数据(元数据是对数据的描述) - 元数据的作用
对文件进行分类和标记(可以将一个文件打上多种标记,更加灵活);
信息检索(直接通过标记来找文件,更加快捷); - 访问对象
通过对象ID来进行访问,存储到“桶“中的每一个对象都有一个唯一的ID标识(只是一个编号),当想要访问某个对象时,只需要知道其对应的ID就可以,因此对象存储会维护每个ID实际对应的硬盘位置
除了对象和对象真实的信息外,还有对象的元数据
- 对象存储中每个对象都有由三个部分组成
注意
对象存储中的文件夹不是一个真正的文件夹,也只是一个对象,如果多个用户同时存储了相同的文件,那么在存储后端只有一份关于该文件的数据。
块存储、文件存储、对象存储、表格存储
存储网络架构
- 按照服务器类型分类
- 封闭系统的存储:主要指的是大型计算机系统。
- 开放系统的存储:指基于Windows、Linux等操作系统的服务器。
- 开放系统的存储(按照存储的连接方式分类)
- 内置存储:一般指直接和计算机的CPU或主板相连的存储,例如内存、高速缓存等。
- 外置存储:非内置存储就是外置内存。
内置存储是直接装于设备内部,外置存储是通过卡槽或插口插在设备内部或外周适当位置,可随意更换的(存储卡或U盘)。
- 外置存储(根据连接的方式分类)
- DAS直连式存储(DAS:Direct Attached Storage):一种存储设备与使用存储空间的服务器通过总线适配器和SCSI/FC线缆直接相连的技术,将存储设备通过SCSI接口或光纤通道直接连接到一台计算机上。
- FAS网络接入存储
- FAS网络接入存储(根据网络传输协议分类)
- NAS网络接入存储/网络附加存储(Network Attached Storage):一种将存储设备连接到网络上,通过网络共享协议向主机提供数据和文件服务的一种存储网络架构。网络存储基于标准网络协议实现数据传输,是网络中各种不同操作系统的计算机提供文件共享和数据备份。具有网络存储功能。
- SAN存储区域网络(Storage Area Network ):一种高可用性、高性能的专用存储网络,通过专用的存储网络将服务器和存储设备连接起来(这个网络可以是FC网络,也可以是IP网络,具体取决于服务器和磁盘阵列之间通过什么样的存储协议进行通信)。允许存储设备和处理器(服务器)之间建立直接的高速网络连接,通过这种连接实现只受光纤线路长度限制的集中式存储。
NAS、SAN、DAS是常见三种存储方式,但其初衷、过程和结果是不同的,三种存储架构的简化示意图如下图所示
DAS直连式存储
DAS(Direct Access Storage,直接连接存储)是指将存储设备通过SCSI接口或光纤通道直接连接到一台计算机上。
- 工作方式:每个主机/服务器,自己管理自己的数据存放的位置与备份方式。依赖于主机的操作系统来实现数据IO读写、数据管理和数据备份。
- DAS的优点:本地数据供给优势明显、成本低、见效快、系统可靠性高。
- DAS的缺点:存在数据传输距离有限、存储所能连接的设备数量有限、资源共享受限等问题。
- 总结:什么都需要主机/服务器干,且扩展性不好。
- DAS分类:内置DAS、外置DAS。
-
内置DAS:存储设备通过服务器机箱内部的并行/串行总线与服务器相连接(常用IDE和SATA连接协议)。
-
外置DAS:存储设备与服务器基于总线直接连接,通过FC、SCSI等协议进行通信
通过将JBOD(磁盘簇)做RAID,然后与服务器连接,提高数据安全性。
-
外部硬盘阵列(外置DAS):通过硬件RAID,RAID卡做RAID,然后通过SCSI卡将服务器与RAID存储设备直接连接。
智能硬盘阵列(外置DAS):通过软件RAID,控制器来做RAID,然后通过SCSI卡实现外置DAS。
NAS网络接入存储/网络附加存储
NAS(Network Attached Storage)—网络连接存储,即将存储设备通过标准的网络拓扑结构(例如以太网),连接到一群计算机上。NAS是一种将存储设备连接到网络上,通过网络共享协议向主机提供数据和文件服务的一种存储网络架构。
- 工作方式:主机/服务器通过网络连接到存储服务器,以方便进行数据的写入、读取;存储服务器负责数据的具体写入和读取过程,同时也控制数据的备份及恢复操作。
- 特点:1、文件系统由存储设备维护,用户访问文件系统,不直接访问底层存储。
2、存储设备拥有所有主机上文件与底层存储空间的映射,利于共享。
3、NAS一般使用用户的业务网络来传输存储数据,可能会影响业务传输。 - 最常用的网络共享协议:CIFS(Window)、NFS(Linux)、FTP、HTTP、NDMP等
- 优点:1、可以实现跨平台的数据共享;
2、即插即用:NAS设备一般支持多计算机平台,用户通过网络支持协议可进入相同的文档,因而NAS设备无需改造即可用于混合Unix/Windows NT局域网内;
3、物理位置灵活:通过物理链路与网络连接起来,无需应用服务器的干预,NAS设备允许用户在网络上存取数据,这样既可减小CPU的开销,也能显著改善网络的性能。 - 缺点:1、应用有局限,不太适合对存储有大规模需求的场景(例如:无法在NAS存储上安装操作系统)。
2、NAS没有解决与文件服务器备份过程中的带宽消耗。与将备份数据流从LAN中转移出去的存储区域网(SAN)不同,NAS仍使用网络进行备份和恢复。NAS 的一个缺点是它将存储事务由并行SCSI连接转移到了网络上。这就是说LAN除了必须处理正常的最终用户传输流外,还必须处理包括备份操作的存储磁盘请求。 - 总结:应用读写数据和存储备份和恢复等数据共用一张网,会挤占“应用”的带宽,影响最终性能。
SAN存储区域网络
SAN是一种高可用性、高性能的专用存储网络,通过专用的存储网络将服务器和存储设备连接起来(这个网络可以是FC网络,也可以是IP网络,具体取决于服务器和磁盘阵列之间通过什么样的存储协议进行通信)。通过光纤通道连接到一群计算机上。在该网络中提供了多主机连接,但并非通过标准的网络拓扑。
- 特点:
1、SAN向主机提供块存储,主机访问块存储(LUN),然后在其中创建文件,文件存储由主机端维护,主机与主机之间的文件系统没有同步。
2、搭建专用于存储的网络,安全性高,成本高。
3、为了使得主机之间使用了哪些存储资源进行同步,这个数据同步的而过程我们称为集群文件系统,是通过在主机上安装相应的软件来实现的;但是集群文件系统使用有限制:所支持主机同步的最大数量为128台主机左右。 - 工作方式:其工作方式与NAS类似,主要区别是流量是否有专网。
- 优点:1、SAN提供了一种与现有LAN连接的简易方法,并且通过同一物理通道支持广泛使用的SCSI和IP协议。SAN不受现今主流的、基于SCSI存储结构的布局限制。特别重要的是,随着存储容量的爆炸性增长,SAN允许企业独立地增加它们的存储容量。
2、SAN的结构允许任何服务器连接到任何存储阵列,无论数据置何处,服务器都可直接存取所需数据。因为采用了光纤接口,SAN还具有更高的带宽。
3、SAN解决方案是从基本功能剥离出存储功能,所以运行备份操作就无需考虑它们对网络总体性能的影响。SAN方案也使得管理及集中控制实现简化,特别是对于全部存储设备都集群在一起的时候。最后一点,光纤接口提供了10公里的连接长度,这使得实现物理上分离的、不在机房的存储变得非常容易。 - 缺点:
1、开销大,费用高!
2、运维复杂:随着大型数据中心的发展,前端网络一般是以太网LAN,后端的是存储网络,一台服务器上下行需要4块网卡,随着服务器数量的急剧增多,连接的线缆是非常庞大的,这不但增加了维护的难度,而且对机房的空间、服务器的功耗都带来较大的影响。 - 总结:真正的应用和存储分离实用。
- 最常用的SAN存储网络
1、IP SAN(主机通过IP网络可以获取到存储设备上的块存储)
2、FC SAN(主机通过FC网络可以获取到存储设备上的块存储)
3、FCoE SAN(RCoE网络是将FC帧封装到以太网种,实现在以太网基础设施上传输光纤信号的功能,成本降低)