前言
信息在网络中的传输,需要借助数据作为载体,那么信息和数据的关系是什么?数据存储的作用是什么?
一、数据与信息
什么是数据
SNIA(Stirage Networking lndustry Assocation,全球网络存储工业协会)对数据的定义:
数据的种类:
结构化数据、半结构化数据、非结构化数据
数据的处理周期
数据处理是人或机器对数据进行的重组或重新排序,以增加其特定的价值。数据处理包括以下基本步骤:输入、处理和输出。
什么是信息
1、信息是已经被处理、具有逻辑关系的数据,是对数据的解释。
2、信息是经过处理的数据,其中包括
具有上下文,相关性和目的的数据
数据据与信息的关系
1、数据经过加工处理之后,能够成为信息
2、信息需要经过数字化转变成数据才能存储和传输
信息生命周期管理
ILM(information life cycle managment )是指从信息产生和初始存储阶段到最后被删除时的一套综合管理方法
二、数据存储
什么是数据存储
数据存储系统
存储成都物理结构
数据存储分类
数据管理技术的演变
数据存储的应用
存储技术的发展
存储架构的发展
1、存储架构历程
2、从硬盘到磁盘阵列
3、从分离到融合
分布式存储
1、通过软件将物理资源组织起来构成高性能逻辑存储池,在保证可靠性的同时提供多种存储服务
2、分布式存储是将数据分散存储在多台独立的设备上,采用可扩展的系统结构、利用多台存储服务器分担负荷、利用位置服务器定位存储信息
存储虚拟化
1、存储虚拟化可以将存储上设备进行抽象以逻辑资源的方式呈现,统一提供全面的存储服务
2、可以在不同的存储形态或设备类型之间提供统一的功能
云存储
1、云存储系统是一个多存储设备、多应用、多服协同工作的集合体,它使用高度虚拟化的多组合基础设施为企业提供可扩展的存储资源,可以根据组织的要求动态配置
存储技术的发展
存储介质的发展
1、机械硬盘发展简史
容量越来远大,体积越来越小
2、固态硬盘发展简史
固态硬盘出现也很早,但是因为20世纪末机械硬盘快速发展而被遗忘
随着对存储速度要求的提高,固态硬盘又开始繁荣发展
3、闪存介质发展
接口协议的发展
1、接口协议:
硬盘接口协议是硬盘与主机系统间的连接部件
接口协议(interface Protocol)指的是需要进行信息交换的接口需要遵从的通信方式和要求
2、接口协议发展简史
3、NVMe与NVMe—oF
存储产品的发展趋势
存储产品发展历程
智能时代来临
智能时代对数据存储的新要求
智能时代数据存储的特征
数据存储发展趋势
存储介质发展趋势
DNA存储
1、少量人造DNA就能保存大量数据,并且可以冷冻干燥、运输和存储数据长达几千年
2、DNA作为存储介质的优势:
①体积小
②密度大
③稳定性强
3、现阶段的瓶颈与局限
①DNA分子合成成本高
②读取和搜索数据的效率不高
原子存储
存储网络发展趋势
华为存储产品发展历程
智能数据存储架构
智能存储组件
控制框
控制框是承载了控制器的机框,对外提供存储服务,他是存储系统中的核心组件
1、控制框部件模块化设计,主要由系统插框、控制器、BBU模块、电源模块、管理模块和接口模块组成
○ 控制器,Ctrl :存储系统中承载业务处理的核心模块
○ BBU模块,能够在系统外部供电失效的情况下,提供后备电源支持,以保证存储阵列中业务数据的安全性
电源模块,PSU(Power supply Unit)电源模块为交流电源模块,支持控制框在最大功耗模式下正常运行
▪ 笔记本电源模式 接入电源后 最大功率模式
管理模块:主要提供管理接口,包括管理网口、串口、维护网口
▪ ○○ 接口模块:IM ,承载业务或管理接口的现场科更换模块
2、控制框组件
Ctrl:核心部件,负责处理存储业务,接收用户的管理配置、保存控制信息,接入硬盘和保存关键信息
控制器上CPU和Cache共同实现对来自主机系统I/O请求操作和对磁盘阵列RAID的管理
▪每个控制器可内置多个硬盘,用于保护存储系统的数据和系统掉电后Cache中的数据
FE(Front end):负责服务器与存储设备之间进行业务通信,对主机I/O进行处理 ○
BE(Back end):负责连接控制框和硬盘框,是数据从硬盘读写的通道
缓存(Cache):硬盘控制器上的一块内存芯片,具有极快的存取速度,是硬盘内部存储与外界接口之间的缓冲器 ○○ 保险箱盘:用于保存存储系统数据,系统配置信息和日志、系统掉电后Cache中的数据
3、级联模块
文字说明:每个级联模块提供一个一级级联端口‘P0’和一个一级级联端口‘P1’,级联模块通过级联端口来级联控
制框和硬盘框,由此来实现控制框或硬盘框之间通信,是双方间数据传输的节点
硬盘
1、机械硬盘
盘片:盘片被磁性材料覆盖,盘片上的磁性粒子被极化以表示一个二进制信息单元
二进制 00000000 00000001 00000010 00000011
2 ^ 76543210
□ 读/写磁头:负责向盘片读取和写入数据。通过磁头改变盘片表面上极细微的磁性粒子簇的NS极性加以存储
□ 磁头臂:带动读/写磁头,将磁头移动到指定的位置
□ 主轴:马达电机和轴承在其下方,转动盘片,将盘片上的指定位置移动到读/写磁头下
□ 控制电路:控制磁盘的速度、磁头臂的移动、向磁头下发命令等。
2、机械硬盘工作原理:
3、硬盘上的数据组织
盘面:每一个盘片都有两个盘面,每个盘面都能存储数据,成为有效盘片
□磁道(Track):磁道是在盘片上围绕在主轴周围的同心环,数据被记录在磁道上。
柱面(Cylinder):同一个盘片中所有盘片(包含上下两个盘面)具有相同编号的磁道形成一个圆柱,称之
为硬盘的柱面
扇区(Sector):每个磁道被分为更小的单元,称为扇区,划分扇区的目的是为了是数据存储更加条理化。
扇区是硬盘中可以单独寻址的最小存储单元
4、硬盘容量和缓存:
硬盘可以分为单碟盘和多碟盘,前者在盘体内只有一张盘片,后者则是有多张。但是银盘每时每刻只允许一个
磁头读写数据,因此盘片和磁头再多,也不能提高硬盘的吞吐量和IO性能,只能用来提高容量
4、硬盘容量
硬盘容量=柱面数磁头数扇区数*扇区大小,单位为MB或GB,影响硬盘容量的因素有单碟容量和碟片数量
缓存(Cache)
由于CPU和硬盘之间存在巨大的速度差异,为解决硬盘在读写数据时CPU的等待问题,在硬盘上设置适当的高速缓存,一解决二者之间速度的不匹配问题,硬盘缓存与CPU上的告诉缓存作用一样,是为了一高硬盘的读写速度。
5、影响硬盘性能的因素
转速:硬盘盘片转动圈数/分钟 ->每分钟盘片转动圈数,单位 rpm
在读写数据时,磁头不会动,靠盘片的转动来感应读取数据,因此盘片转动速度越快,数据传输时间就越短
寻道速度:随机IO情况下,磁头臂需要频繁更换磁道,用于数据传输的时间远小于用于换道消耗的时间
6、平均访问时间
平均寻道时间:指硬盘的磁头从初始位置移动到盘面指定磁道所需要的时间,是影响硬盘内部数据传输速率的重要参数
平均等待时间:指磁头已处于要访问的磁道,等待需要访问的扇区旋转至磁头下方的时间
7、数据传输速率
内部传输速率 :内部传输速率 也称为 持续传输率(Sustained Transfer Rate),指磁头读写硬盘时的最高
速率。
进行一种理想情况的假设,磁头读写时不需要换道,也不用专门读取某一个扇区,只在一个磁道上连续的
读写这个磁道的所有扇区
外部传输速率:举例 USB2.0 和 USB3.0
8、磁盘的IOPS和传输带宽
▪ 寻道时间:寻道时间越短,I/O操作越快,目前硬盘平均寻道时间一般在3-15ms
▪ 旋转延迟:盘片旋转将请求数据所在扇区转移至读写磁头下方所需要的时间。
▪ 数据传输时间:完成传输所请求的数据所需要的时间
▪ 在随机IO情况下,因为换道时间>>>数据传输时间,因此数据传输时间科忽略不计
并行传输和串行传输
并行传输
□ 并行传输传输效率高,但是传输距离不长,传输频率不高
□ 在长距离上,使用多条线路要比使用单一线路要昂贵
□ 长距离传输要求较粗的导线,以便降低信号的衰减,但把他们(传输信号)捆到一条单独电缆中相当困难
□ 长距离传输时,受导线电阻或其他因素影响,每条线上的数据到达对方的速度不同,从而导致接收方必须等8
条线上的所有数字都到达之后,才能发起下一轮的传输
□ 传输频率太高时,电路告诉震荡的时候,数据线之间会产生很大的干扰,因此并行传输的时候频率不能太
高。
串行传输
□ 串行传输在效率上显然比并行传输低得多,但是可以通过提高传输频率来提升串行传输的传输速度,总体来
说串行传输反而比并行传输的总体速率更快
□ 串行传输用于远距离传输,目前如PCI接口都转向串行传输方式。PCIE接口就是典型的串行传输方式,其单
条线路的传输方式高达2.5GB/S