目录
一、磁盘存储概念
磁盘是计算机的外部存储器设备,由一个或多个覆盖有磁性材料的铝制或玻璃制的碟片组成,用来存储用户的信息,这种信息可以反复地被读取和改写。
1. 磁盘的分类
依据存储介质区分
- 机械硬盘(HDD,Hard Disk Driver)
采用磁性碟片来存储数据
盘片凸起的地方代表数字1 (磁化为1) ,的地方代表数字0
以二进制来存储表示文字、图片等信息
根据转速来判断硬盘的好坏,一般硬盘转速为7200转/分,大概读取100-200M/s的数据
- 固态硬盘(SSD,Solid State Disk)
- 通过闪存颗粒(固态电子存储芯片阵列)来存储数据
- 不需要机械结构,完全的半导体化,不存在数据查找时间、延迟时间和磁盘寻道时间,数据存取速度快。读取速度可以达到400M/s,写入速度可以达到130M/s以上
- 数据丢失的可能性能够降到最小,没有任何噪音,功耗低
依据热插拔方式区分
- 热插拔(Hot-Swap)
- 可以在计算机运行时插入或拔出的硬盘,实现服务器高可用性和灵活性
- 需要硬件支持,包括支持热插拔的硬盘托架(Hot-Swap Bay)和主板/控制器
- 非热插拔(Non-Hot-Swap)
- 需要在系统关闭或处于待机状态时才能插入或拔出的硬盘,插入或拔出硬盘需要重启
- 不需要特殊的硬件支持
依据存储连接方式区分
- 本地存储---如服务器硬盘
- 外部存储---如移动硬盘、U盘
- 网络存储---如网络附件存储(NAS)、存储区域网络(SAN)
- 通过网络连接提供数据存储服务的技术
- 允许多台计算机通过网络访问、读写和共享存储资源,而无需直接连接到存储设备
- 提供了一种集中管理和共享数据的方式,为多用户、多计算机的环境提供了便捷的数据存储和访问解决方案
2. 网络存储介绍
- 网络附加存储(NAS)-- 一个网络上的文件系统
一种通过网络连接的存储设备,存储设备通过标准的网络拓扑结构(以太网)添加到一群计算机上,专门用于文件共享和存储。NAS设备通常运行专用的操作系统,提供文件级别的访问,并使用协议如NFS(Network File System)和SMB/CIFS(Server Message Block/Common Internet File System)。
NAS有一关键问题,即备份过程中的带宽消耗,NAS仍使用网络进行备份和恢复。NAS的一个缺点是它将存储事务由并行SCSI连接转移到网络上,也就是说LAN除了必须处理正常的最终用户传输流外,还必须处理包括备份操作的存储磁盘请求。
- 存储区域网络(SAN)-- 一个网络上的磁盘
通过光纤通道交换机连接存储阵列和服务器主机,是一种专用的存储网络,将存储设备连接到计算机网络。SAN提供了一种与现有LAN连接的简易方法,并且通过同一物理通道支持广泛使用的SCSI和IP协议。SAN允许企业独立地增加它们的存储容量。SAN的结构允许任何服务器连接到任何存储阵列,这样不管数据放在哪里,服务器都可以直接存取所需的数据。因为采用了光纤接口,SAN还具有更高的带宽。它的跨平台性能没有NAS好,价格偏高,搭建SAN比在服务器后端安装NAS要复杂的多。
- 直连存储(DAS)
直连式存储与服务器主机之间的连接通常采用SCSI连接,SCSI通道是IO瓶颈;服务器主机SCSI ID资源有限,能够建立的SCSI通道连接有限。无论直连式存储还是服务器主机的扩展,从一台服务器扩展为多台服务器组成的群集(Cluster),或存储阵列容量的扩展,都会造成业务系统的停机
- 分布式存储
分布式文件系统(Distributed File System)指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点(简单的理解为一台计算机)相连。分布式文件系统的设计基于客户机/服务器模式。一个典型的网络可能包括多个供多用户访问的服务器。另外,对等特性允许一些系统扮演客户机和服务器的双重角色。例如,用户可以”发表“一个允许其他客户机访问的目录,一旦被访问,这个目录对客户机来说就像使用本地驱动器一样。
分布式文件系统可以有效解决数据的存储和管理难题:将固定于某个地点的某个文件系统,扩展到任意多个地点/多个文件系统,众多的节点组成一个文件系统网络。每个节点可以分布在不同的地点,通过网络进行节点间的通信和数据传输。
即分布式文件系统是一种通过多个节点协同工作的文件系统,通常部署在大规模的集群环境中。这些系统提供了高度可伸缩性和冗余性,允许大规模存储和访问文件数据。例如,Hadoop Distributed File System(HDFS)和Ceph是常见的分布式文件系统。
- 云存储服务
云存储是在云计算(Cloud Computing)概念上延伸和衍生发展出来的一个新的概念。云计算是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的发展,是透过网络将庞大的计算处理程序自动分拆成无数个较小的子程序,再交由多部服务器所组成的庞大系统经计算分析之后将处理结果回传给用户。通过云计算技术,网络服务提供者可以在数秒之内,处理数以千万计甚至亿计的信息。
云存储指通过集群应用、网格技术或分布式文件系统等功能,网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统,保证数据的安全性,并节约存储空间。
简单来说,云存储就是将储存资源放到云上供人存取的一种新兴方案。使用者可以在任何时间、任何地方,透过任何可连网的装置连接到云上方便地存取数据。
二、磁盘分区
1. 分区的作用
- 便于管理硬盘上的数据:通过将硬盘分成多个区域,用户更容易区分不同类型的数据,例如操作系统文件、应用程序、用户文件等。有助于使文件系统更有序,提高数据管理的效率。
- 有助于提高硬盘的性能:将操作系统和应用程序安装在不同的分区上,有效减少磁头的移动,提高了访问速度。对于固态硬盘(SSD)等一些硬盘类型,分区的优化也可以影响性能。
- 提高数据安全性:将操作系统和用户数据分开存放在不同的分区中,更容易进行备份和恢复操作系统,而不影响用户数据。如果系统发生故障,也更容易对某个分区进行修复,而不影响其他分区。
- 支持多重引导:允许在同一硬盘上安装多个操作系统。每个操作系统可以安装在不同的分区上,这样用户可以在启动时选择要启动的操作系统。这对于在同一台计算机上运行不同的操作系统或测试新操作系统非常有用。
- 有效地利用硬盘空间:用户可以在单个硬盘上创建一个用于操作系统和应用程序的小分区,而将其余的空间用于存储用户数据。有助于更好地管理硬盘空间,防止某个区域的数据过度增长导致空间不足。
2. 分区表的分类
MBR(Master Boot Record)
MBP分区表是一种用于在计算机硬盘上管理分区和引导操作系统的标准分区方案。MBR分区表通常位于硬盘的第一个扇区(逻辑块0),其大小为512字节。这个512字节的区域包含了分区表以及引导加载程序的代码。
关键特点:
- 分区表:MBR分区表最大支持4个主分区。每个主分区可以包含一个独立的文件系统,如FAT32或NTFS。如果需要更多的分区,其中一个主分区可以被指定为扩展分区。
- 扩展分区:是主分区中的一个,用于容纳逻辑分区。逻辑分区数量不受主分区数量限制,因此扩展分区允许更多的分区。但是,扩展分区本身不能直接用于存储数据,而只是作为逻辑分区的容器。
- 引导加载程序:MBR中的最后两个字节(511和512)通常包含引导加载程序的代码。这是计算机启动时执行的代码,用于加载操作系统的引导扇区。引导加载程序的任务是在硬盘上找到操作系统的引导扇区,并将控制权传递给该引导扇区。
- MBR限制:MBR分区表的设计存在一些限制,其中最突出的是对分区的数量和大小的限制。由于历史原因,MBR分区表最多支持4个主分区,且主分区和扩展分区的大小限制为2TB。
- Legacy系统支持:MBR分区表是早期计算机系统和BIOS固件的标准,支持的操作系统包括DOS、Windows、Linux等。然而,由于其限制,对于现代计算机和大容量硬盘,通常采用更先进的分区方案,如GPT(GUID Partition Table)。
GPT(GUID Partition Table)
GPT分区表是一种用于在计算机硬盘上管理分区的现代分区方案。
关键特点:
- GUID(Globally Unique Identifier):GPT使用128位的GUID作为每个分区的唯一标识符。这样的设计使得GPT支持更多的分区,避免了MBR中限制分区数量的问题。
- 支持更大的硬盘容量:GPT分区表支持更大容量的硬盘,可以处理超过2TB的硬盘空间。相对于MBR,GPT的硬盘容量限制大大提高,适应了现代大容量硬盘的需求。
- 主分区和逻辑分区的差异消失:GPT不再有主分区和扩展分区的概念。所有分区都是主分区,因此不再受到主分区数量的限制。GPT支持更多的分区类型,包括备份分区表、EFI系统分区等。
- 更强的数据完整性和容错性:GPT包含备份分区表,存储在硬盘的末尾,以提高数据完整性和容错性。如果主分区表损坏,系统可以使用备份分区表进行恢复。
- 安全性增强:GPT使用CRC32校验和其他方法来验证分区表的完整性,以帮助检测潜在的数据损坏,有助于提高硬盘的可靠性。
- UEFI兼容性:GPT分区表是UEFI(Unified Extensible Firmware Interface)标准的一部分,与现代计算机使用的新一代固件兼容。与MBR不同,GPT分区表不受BIOS引导时的限制。
MBR和GPT分区表的区别
- MBR分区表最多只能识别2TB左右的空间,大于2TB的容量将无法识别从而导致硬盘空间浪费;GPT分区表则能够识别2TB以上的硬盘空间。
- MBR分区表最多只能支持4个主分区/3个主分区+1个扩展分区(逻辑分区不限制);GPT分区表在Windows系统下可以支持128个主分区。
- MBR分区表中的大小是固定的;GPT分区表头中可自定义分区数量的最大值,即GPT分区表的大小不是固定的。