由于公司业务的关系,本人接触存储设备已经有段时间了,也看了先人前辈们关于存储设备的心得体会。现将自己所学所得汇聚成文,非为上品,只想将所学零散的知识通过本文的编写得到疏理。使慨念更加清晰,也想为以后的学习工作,及了解存储本源找到方向。
         之前我拜读并参考了《大话存储》一书,从盘古开天讲到现在,从上古神话时代人们如何存储信息说到当今社会存储设备,每个知识点的讲解角度都是标新立意,这位仁兄可谓大才,余以为此书受"博大精深"四字亦不为过,不胜钦佩向往之。同样事物每个人所讲角度与方向不同,如果让我也从神话时代说起,那没准就真说成神话故事了。所谓这个切入点我想从硬盘说起,现在PC的普及率就不用说了,基本家家必备,那么有PC必有硬盘,我就从硬盘开始说。而且本文也并不想写成像"资治通鉴"一样的编年体史书,那些什么哪年谁谁谁发明了什么东东,虽说前事不忘后事之师,我想我们应该记住的是前事的因果而并非死记年限。还有,存储设备所涉及到的知识点很多,如硬盘原理、接口、文件共享等等很多很多,说到的时候会用简练的语言提及一些,但不会主要细说哪一块,真要那样一篇文章得写个好几年。好了,闲言少叙,书归正传!

         硬盘,基本上家里有PC的都知道硬盘,做什么用的,都知道存数据用的。它怎么来存呢,这就涉及到硬盘原理。其实把硬盘打开看到硬盘的盘体,就像一落光盘一样只是边上多了一个机械部件:
         与光盘不同的是,硬盘的盘体上面和下面都可以写数据。拿什么来写,自然是盘体上放置的磁头,每个盘体都有,而且上下面都有,这可是十分精密的机器设备,因为磁头与盘体是有距离的,有多远?呵呵,你头发的粗细与这个距离相比算巨人了,哈。应往哪里写呢,就像一张纸,如果有格式我们就可以根据格式往上写字,硬盘也是一样,盘体是圆形,从最外围到最里边,可以看成好多个圈圈,叫磁道。每个圈圈又划分了好多个段落,叫做扇区。硬盘通电后盘体开始高速旋转,写数据时,先找是哪个盘体,是上面是下面,再找哪个磁道,最后找到扇区往里写数据,读数据也是一样。关于原理就说这么多,有兴趣可以去翻翻书:)
         怎么读写数据知道了,那么数据从哪里来呢。看到图中盘体边上的接口了吗,就从接口传输进来。从这里就引出了硬盘接口的类型,以中国来看从九十年代末期到现在共有这么几种类型:
IDE
       IDE的英文全称为“Integrated Drive Electronics”,即“电子集成驱动器”,一个IDE接口只能接两个 外部设备。一般用于PC机,最高转速7200转。传输速度为:最高 133MB/s硬盘容量最高达 500G,据说有 1TB,此接口现已淘汰。
SCSI

       小型计算机系统 接口(Small Computer System Interface),一个SCSI可连接最多15个外设(包括 磁盘磁带CD-ROM、可擦写 光盘驱动器打印机扫描仪和通讯 设备等)。连接外 平等占有总线,现在为止接口传输速度最高可达 640MB/s,转速 7200转、 10000转、 15000转都有, 10000转性价比最高。连接 电缆可以长达6m。容量最高 300G,现已基本淘汰。
 
SATA

SATA一种基于行业标准的串行接口(Serial Advanced Technology Attachment),来头不小,是由Intel、IBM等等多家硬盘大佬们共同提出的 硬盘接口规范。接口需主板芯片组支持。支持 热插拔,传输速度快,执行效率高。现在 SATAIII的接口速度最高可达 600MB/s;转速 7200转。容量现最高 4TB。是现在PC机与部分存储设备使用的主流硬盘!  
SAS

SAS(Serial Attached SCSI)即串行连接SCSI,是新一代的SCSI技术,改善原SCSI的效能、可用性和扩充性,提供与SATA接口的兼容性。为适合不同硬件环境,接口尺寸有3.5英寸和2.5英寸两种,同样转速 7200转、 10000转、 15000转都有,容量现最高 2TB。传输速度 300MB/s,这只是刚起步,预计将来会更高。
NL-SAS
NL-SAS和SAS从技术上来说,没什么太大区别。说白了就是使用SATA的盘体,但接口标准是SAS标准。所以转速最高 7200转,容量最大是 3TB
 
固态硬盘

固态硬盘(Solid State Disk)用固态电子 存储芯片阵列而制成的硬盘。接口规范和定义、功能及使用方法上与普通硬盘的完全相同,在产品外形和尺寸上也完全与普通硬盘一致。普遍采用 SATA-2接口及 SATA-3接口,最大容量 128GB,理论最高速度 6Gb/s。分为两种:
       一种是采用 闪存FLASH芯片)作为 存储介质,即我们常说的 SSD。最大的优点就是可以移动,而且数据保护不受 电源控制,能适应于各种环境,但是使用年限不高;
       另外一种是采用 DRAM作为存储介质。 仿效传统硬盘的设计,可被 操作系统文件系统工具进行卷设置和管理,可分为 SSD硬盘和 SSD硬盘阵列两种应用。高性能的 存储器,使用寿命很长,但需要独立电源来保护数据安全。属非主流固态硬盘!
 
FC

拥有 光纤通道接口( FC, Fibre Channel)的硬盘, 此接口最初为互联网设计,后应用于硬盘接口。硬盘在使用光纤联接时具有热插拔性、高速带宽( 4Gb/s)、 远程连接等特点,可持续性数据传输 171MB/s。使用多模光纤联接时最远可达 500米;使用单模光纤联接时最远可达 10千米。转速 15000转,容量最高限制于其高昂的售价, 通常用于高端 服务器领域(本身设计初衷也非民用).

硬盘及接口可算说完了。搞这么多似乎有点抢戏,呵呵。因为存储本身故名思义,就是存储数据,所以接的都是硬盘,不先说清楚后边也没法讲。就算这样其实各种接口还是没能够说清楚,看来就硬盘应该单开一文多方参考而后撰之~-~
如果上述看不懂也关系,因为都知道PC机内有硬盘,而高端的设备如服务器、小型机、大型机等等也是一样,不过配置有高有低;有简单有复杂罢了。那么我们试想一下,以服务空为例:在一个生产环境,服务器如果只把数据存在本地硬盘里,那么需要多少硬盘?多少台服务器?我的邮件服务器存邮件数据;文件服务器存大批工作文件;网站服务器存站点程序;数据库服务器存DB数据;要是本地硬盘容量不够,可不仅仅是加硬盘就行的事情,像一些大型网站或数据中心,数据以 TBPB计,这要加多少块硬盘才够?呵呵。服务器本身要工作,还要有频繁的重要数据读写,要是服务器哪一个部件出了问题,当机了还算幸运,要是造成数据的损坏可就麻烦了,医院的病历、药品信息;金融的各种金融数据;企业的保秘数据;甚至一个国家的。。。。。。天哪,这得造成多大的损失!一张纸要 800年才会自然毁灭,还不如纯人工手记呢,哈哈。而且搞得数据这里一份,那里一份,管理起来相当麻烦。怎么办?这个时候,存储设备就应运而生。
服务器该工作还工作你的,我们将所有的数据归拢统一到一个设备或一批设备里,用一种快捷方便且相对安全的保护机制来保存数据,而且别的不干只存数据,心无旁骛自然一日千里,这就是存储设备产生的初衷。内部构造先别想的多复杂,跟服务器差不多,只不过服务器能连接的硬盘有限,存储设备呢,除了主板啊CPU啊等这些主机设备外,毕竟以存数据为主要工作,所以有这么一个专门设备(说白了就是一电路板)连接好多块硬盘,只不过这里管插多少块硬盘叫多少位,8位就是8块,12位就是12块,以此类推~接硬盘的电路板可以叫它硬盘插槽,8位也叫8 槽位
从存储设备的前边来看,瞧瞧,这就是存储设备的槽位!
而主机设备在这里叫做 控制器,是由控制器来把外部数据放入到这老些硬盘里的;当然要想工作必须通电,所以还有电源。简单地说,存储设备从硬件来看就这几样:控制器、硬盘插槽、硬盘、电源。
这张图是从存储的边后来看,左边就是控制器,而右边的是电源
 
从软件来看呢?刚刚说过,快捷方便且相对安全的保护机制,这种保护机制叫做 RAID
独立磁盘冗余阵列( RAID,redundantarray of independent disks,redundantarray of inexpensive disks)怎么用的呢,那么多硬盘不能都闲着,把相同的数据存储在多个硬盘的不同的地方。通过把数据放在多个硬盘上,输入输出操作能以平衡的方式交叠,改良性能。因为多个硬盘增加了 平均故障间隔时间,储存冗余数据也增加了容错。而这种功能也会软件两种:
RAID

磁盘阵列卡-拥有一个专门的处理器与 存贮器,用于高速缓冲数据。使用磁盘阵列卡对磁盘的操作直接通过阵列卡来进行处理,因此不需要大量的CPU及 系统内存资源。但对实施人员水平会有要求。实物见下图:
RAID
即通过软件方式来达到硬RAID功能,不同的是需要使用CPU及系统内存资源。对实施人员水平倒没多少要求,其实WINDOWS的磁盘管理就能做,哈。
分类是这两种,那么RAID具体的实现方式是什么呢?就是业内人士常说的什么 raid1raid0raid5啥的。在 《大话存储》这本书里介绍的较全,我只列出常用的几种:
raid0:最早的raid实现方式,其实很简单,好比说存储有8块硬盘,我把数据分散存到这8块硬盘上,不是分文件而是分散,一个文件被拆成多个部分分别存在多个硬盘上。但在应用层看到还是完整的文件,至少需 块盘。缺点是万一哪块硬盘坏了,全完了,哈哈。
raid1:叫做磁盘镜像,数据在写入一块磁盘的同时,会在另一块闲置的磁盘上生成镜像文件,保证系统的可靠性和可修复性,只要系统中任何一对镜像盘中至少有一块磁盘可以使用,系统都可以正常运行,至少也需 块盘。虽然这样对数据来讲很安全,但是成本也会明显增加,甚至造成浪费!
raid1与raid0配合使用:上述 raid1的缺点,在同一时间内只能向一块磁盘写入数据,不能充分利用所有的资源。为了解决这一问题,我们可以把RAID0和RAID1技术结合起来,有 raid1+0raid0+1两种模式。
raid1+0—是先做镜像再做条带,以四块硬盘为例,两组raid1,再将两个盘组做raid0,raid1两盘组各坏一块盘还能用继续用。所以至少需四块硬盘。
raid0+1—是先做条带再做镜像,同样以四块硬盘为例,两组raid0,将两盘组做raid1,若两盘组各坏一块盘就不能用了,但如果一个盘组的两块盘都坏了,还是可以继续用。
相比之下,raid10比raid01要可靠,raid01的写速度要快。
raid5:分布式奇偶校验的独立磁盘结构,好复杂的名字。。。。。每块盘的数据有其对应的 奇偶校验信息, RAID 5不对 存储的数据进行备份,而是把数据和与其相对应的 奇偶校验信息存储到组成RAID5的各个磁盘上,且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。当 RAID5的一个磁盘数据损坏后,利用剩下的数据和相应的 奇偶校验信息去恢复被损坏的数据。最少 块盘!
raid6:带有两种分布存储的奇偶校验码的独立磁盘结构,更复杂的名字。。。。。天。与 RAID 5相比, RAID 6增加了 第二个独立的 奇偶校验信息块。两个独立的校验系统使用不同的算法,即使两块磁盘同时失效也不会影响数据的使用。但RAID 6需要分配给 奇偶校验信息更大的磁盘空间,所以与RAID5相比,实际应用不多。至少 需块盘
说到这里,存储设备的硬件和软件大至聊完了,其光是存储的 内设与raid也够写好几篇博客了,哈,有空再说。简单地说就是一大堆硬盘和主机设备 在一起通过 raid方式存储数据。那这些数据是怎么 的呢?自然是通过服务器与存储进行数据通迅来的,如何进行数据通迅的呢?这又引出了存储与服务器的 连接!
最早的存储设备,咱们追溯到 IDE硬盘的年代,那个时候服务器硬盘很多都是SCSI接口,在服务器的主板PCI接口上插入 SCSI,SCSI卡的接口用数据线与 SCSI硬盘连接。而存储呢,那个时候直接连服务器,用的什么呀?自然也是SCSI接口连接服务器的SCSI卡,叫做 直连存储
图为 SCSI
后来随着 互联网的兴起,才有了应用到网络的存储设备,说白了就是SCSI接口改了 RJ45口,服务器与存储设备都连接 交换设备进行数据通迅,而SCSI卡自然就免了。再到后来(其实也没多久),因为百兆网络升级成千兆以极万兆或光纤环境,那RJ45口自然也跟着 升级,所以存储设备后来也有千兆接口的、光纤口的。这些除了光纤与万兆口外,其它两个看着差不多:
如上图所示:百兆、千兆口就是那两个RJ45口,外表没什么变化,只是接口速度不同。百兆是 100Mb/s,实际应用上 10MB到头了;千兆是 1000Mb/s,实际应用也就 100MB
而图中右边的 个接口,看着跟 8个窟窿眼儿外加铁架子一样的就是光纤口。要说起光纤口那又多了去了,也是从互联网技术而来。我只说现在存储常用的 光纤口,纯光纤与模块光纤。
先说 纯光纤:FC(Fiber Channel),应用光环境的存储设备与服务器。在整个网络传输时,一般像文件共享啦、FTP啥的,走的都是微软的TCP/IP。而FC协议不在这之内,从物理层到应用层有自己的数据传输协议,叫做类以太网协义。也是基于网络实现的。而 纯光纤接口,也叫 FC口,是固化在存储控制器主板上的。速度 8Gb/s

模块光纤:与纯光纤口同理,模块是指可以将光纤接口取出,换成 RJ45网络模块
 
咱们在看一个存储设备参数时,如果有 万兆网口,这个接口就是插槽,可以插光纤模块,也可以换成的 RJ45的万兆模块,万兆模块长什么样,接口就是RJ45,身体跟上图光模块一样。速度嘛, 10000Mb/s1000MB左右。
到这里,算是简单说完了存储设备与服务通迅的接口,其实每一个都有不低的技术含量,互联网技术与存储技术的相互融合带来了存储通迅上相当大的飞越!但光是存储飞越不行,同样的环境,服务器也要有相应的设备才能同时飞越,存储是光口,存储还是网口,根本就无法工作。
       千兆网环境,存储的网口要是千兆的;交换设备接口要是千兆的;服务器网卡要是千兆的;甚至连网线也要六类线才行。
       万兆网环境同理,只不过物理线路还没有那么快,只是 接口速度提升了。
从这里引申出一概念叫做 SAN存储区域网络,不单止一台存储,而是多台存储设备组成的工作局域网,而网络环境是上述千兆或万兆,物理线路是网线的叫做 IP SAN
       光环境,这里要说一下,不管存储是纯光纤接口亦或是光纤模块,交换设备接口必须是光纤口;而服务器方面要在主板上插光纤卡,叫做 HBA卡。
关于 HBA卡:(Host Bus Adapter)光纤存储卡,用于服务器与光纤阵列规的连接
上图的 HBA卡,左边为双接口带一个冗余接口,就是一个坏了还能继续用;右边的不多说了。将 HBA卡接到服务器主板上,装好驱动就可以用了。
而在光环境下的存储设备—交换设备—服务器的连接线是什么呢?自然是 光纤线,见下图:
上边所提到的 存储区域网络,多台存储设备组成的工作局域网,网络环境是光纤,光交换设备、光纤接口,物理线路是光纤线,叫做 FC SAN
 
各种环境的连接应用也算简单说完了,至于具体的参数啊型号啊,要是再说这些估计还没说完我就完了,个人认为一边深入了解原理一边根据需求看型号参数比较好。好的,以上说完了存储的硬件、存数据的方式、各种应用环境,不同的应用环境自然设备不同,那么存储设备在对应不同的应用环境会有哪些不同的设备,这是接下来也是最后一个话题,存储的分类!
 
正所谓物以类聚,人以群分。现在来说说存储设备的分类,任何产品都有不同的受众群,同样一本"西游记"也有少儿读本与成年人读本之分;像PC或笔记本适合普通大众;服务器适合工程使用;哪怕说人-还分三六九等呢,是不是。存储设备也是一样,但怎么来区分呢?就两个字: 需求!家里就上上网看看电影啥的,买台服务器回家?新浪网的访问量如此之大,就用PC当做网站服务器?那真是吃饱了撑的,这些当然是不合适的。所以说要根据不同的应用环境与技术标准来决定产品的受众与分类。存储设备的分类从需求来说分为三种:
在线存储

在线存储也称做盘阵,故名思义就是要时刻保持在线状态,读写数据频繁,工作环境对存储的性能要求颇高。所谓颇高是指控制器的配置要高;而且最少都是 双控制器(以上),可以外接 扩展柜;接口基本上使用的是 FC接口;硬盘嘛, SATA的有, SASNL的有, SAS的有, 光纤接口硬盘的也有。所以其工作环境,交换设备基本都是光纤或千兆网(包括万兆)设备,服务器自然也配有光纤卡( HBA),从应用层认到的存储设备是 SCSI卷。盘阵的raid机制都是 raid
还有一种叫做 iSCSI盘阵,控制器与硬盘与上述相同,也是做 raid但接口都是千兆网或万兆网,这就说明网络协议走的都是 TCP/IP协义,应用层认到的设备是 iSCSI设备。说到这里有几名词需要解释:
扩展柜—就是安装硬盘用的柜子,只是作为容量 扩展单元,不能做为独立部件使用。 一般与存储设备配合工作;外型有塔式、全铝合金桌面型设计,可以容纳5-12颗硬盘,与再购买一台存储相比,更能 节省机柜的空间。
SCSI设备-SCSI硬盘已经聊过了,那么SCSI设备是什么,盘阵将所有硬盘空间做成 raid存储方式,这时应用层所看到和真正使用用的是一块盘或几块 SCSI硬盘注意:不是分区!而且将存储设置好之后,在服务器应用层是 自动认到,好比说在windows的磁盘管理里会自动跳出认出新设备的窗口:)至于 iSCSI是什么,这就要说到 近线存储
 
近线存储  

指将那些并不是经常用到,或者说数据的访问量并不大的数据存放在性能较低的存储设备上。近线存储对性能要求相对来说并不高,由于不常用的数据要占总数据量的比较大的比重,这就要求近线存储设备的容量需求相对较大。好比说给一些长期保存的不常用的文件做归档。上述实现这种概念的设备叫做 NAS,即 网络附加存储
归档—就像我们把不常用的东西收拾起来装好一样,这透出一个归字。数据也是一样,我本身的盘阵不留这些数据,将这些数据归档存储到近线设备上。只是这里需求不同,有些环境归档不要求时常能读取到这些数据;有些是要求的;而有些不仅要求还要与在线数据同步。其实归档只是个概念或目地,实现其目地的技术手段统称叫做 备份。既然提到了归档,那索性就再说说备份的几种机制。
备份—其实无论是什么存储设备,目地都是存数据,除了最原始的拷贝之外,还有几种很智能的备份机制。
增量备份—我们先把数据备份到存储设备上来,下一次再备份的时候如果只是拷贝过来,那么会有大量地数据重复覆盖。增量备份的机制就是已有的数据不备份,只备份新增加的数据。
数据同步—要求存储设备上备份的数据与原始数据保持一致,它增我增,它减我也减。
实际上述几种备份机制时,还可以根据时间即 年、月、日,甚至有的设备还提供 时、分时间机制,可 定时做备份。
NAS一般提供最基本的两种服务, iSCSI盘与文件共享。先说文件共享,因为大多数人离这个名字较近,用过WINDOWS的人基本上或多或少接触过共享目录共享分区,只不过NAS所以提供的更多,除WINDOWS外,Linux的 NFS、MAC的 AFP,还有 telnetFTP等等。
iSCSIInternet 小型计算机系统接口 (Internet Small Computer System Interface)是 IBM大佬研发的,该技术是将现有 SCSI 接口以太网络(Ethernet)技术结合,供硬件设备使用实现在 IP网络上运行SCSI协议,使其能够在 以太网上使 服务器可与使用IP网络的储存装置互相 交换资料。在需访问资源的客户端应用层认到的是 iscsi,不过这可不像盘阵,需要应用层用 iscsi发起器来扫描并连接设备,发起器在windows7有自带,Linux有相关命令。
除上述两种功能外,NAS还提供相应的 优化存储资源的功能,比如说像数据删重,即将重复数据取出,这样可以节省空间;在线扩容,不间断工作,更换NAS的硬盘等等。这些功能同指化严重,基本上企业级NAS都有,只不过有些NAS需要购买序列号激活功能而有些不用罢了。
除功能以外,NAS不像盘阵,不光是机架式的,也有 塔式的,如图所示:
所以其应用较广,除生产环境外,公司部门甚至个人用户也可以用得到。而控制器、接口、硬盘接口等性能方面,根据需求的不同,配置自然也不同,一般都分为 低、中、高端三类,配置自然也是 由低到高,甚至在特定的环境里高端NAS也可以当做低端盘阵来用。这一切要以 需求出发,不过需说明NAS的 raid机制,不像盘阵都是硬raid,有些是 raid;有些是 raid
 
离线存储
         离线存储设备在业内所有存储设备当中算是较 特殊一种,可以说不管是与盘阵还是NAS相对独立(那二位好歹还有点关系)。先说说它的 需求来源,即企业的 大数据需长期保存。好比说金融行业的数据,我国规定是要保存十年以上,这是根据行业规则来的需求;再比如说医院的数据,不管是各项检查的数据还是病人病历以及药品数据,这些数据中的一部分是不经常读写,甚至会放置很久,这些数据如果只放在盘阵或NAS里,因为设备会经常有读写数据操作,我说过存储设备的安全机制是相对安全,对于在生产环境设备未来会出现什么问题,我们人为的预估只能占部分比例,毕竟这世上就没有什么绝对的事情,既然设备会经常有读写操作,那就难保会出问题,出问题的结果往往导致了数据损失,有些数据损失又会是致命的,所以怎么办呢,正所谓 一动不如一静!真要保证数据安全的方法往往静止不动,要是这些需要长期保存而长时间不会读写的大量数据所放置的设备,不像盘阵或NAS那样经常被读写,只在需要的时候被导入到在线或近线亦或是服务器本地硬盘,这样问题就解决了,所以离线存储设备就这样应运而生。
         所用的设备是什么呢?在我国八十年代末九十年代初,录像机与录音带可以说是风靡大江南北,可以听歌、录像、看录像,其实所记录的音频与影像资料其实就是数据,所以加以改动一样可以应用到存储设备上,名称也不一样了。录像带叫磁带、录像机叫磁带机(也叫磁带驱动器)、后来又有了相对智能的磁带设备叫磁带库、再后来甚至有了用盘阵做为底层存储的虚拟带库。
磁带
         能够存储数据的磁带跟录像、录音带一样,也用的是胶片来记录数据,当开始写数据时,就像录音带开始录音一样,顺序写入,当开始随机检索时自然也像录音带一样倒带。只是为了与应用层配合使用,业内开发了多种可以数据交互的协议,比如说像常见的 LTO即线性磁带开放协议,提供对磁带数据的写入、检索、纠错等等功能。说到这里,到底为什么使用磁带其实还不是完全清楚,上述说大数据量长期存储,基于这点就引发出两点原因,一是现在 20TB以上和 PB级的数据做离线来说,就磁带与硬盘相比较,磁带的性价比非常高;二是磁带与硬盘在应用上最大的不同是,磁带写满数据后,可以自动弹出然后保存起来,放保险箱里或安全妥帖的场所,这就符合了需求来源中所提到的一动不如一静!说到这里又产生了一个问题,那么磁带是被什么设备读写数据然后弹出的呢?这种设备叫磁带机!
 
磁带机

       磁带就像录像带;那么磁带机也就如同录像机。录像机把影像数据存到录像带上,也可以把录像带上的影像数据放映出来,录完像或放映完录像带从录像机里取;磁带机也同样能把数据写入到磁带上,同样可以把磁带上的数据恢复回来,磁带机也同样能把磁带 弹出做离线保存。现在磁带机(也叫磁带驱动器)分两种,一种是手动将磁带放入磁带机;一种是自动放入,叫自动加载机,带磁带卡槽。从广议上来讲,自动加载机其实算不上真正意义上的磁带机,而应属于一种叫 磁带库的产品。
磁带库
       磁带库,先理解'库'这个字的含义。像车库、库房之类,那么以此类推磁带库里应该会放置很多个磁带(即磁带卡槽)与磁带机,这很像上述所说的自动加载机:
       自动加载磁带机是一个位于单机中的磁带 驱动器和自动磁带更换装置,它可以从装有多盘磁带的磁带匣中(就是磁带卡槽位)拾取磁带并放入驱动器中,或执行相反的过程。可以备份 100GB—200GB或者更多的数据。
       而磁带库是指像自动加载磁带机一样的基于磁带的 备份系统,磁带库由多个磁带 驱动器、多个槽、 机械手臂组成,由机械手臂自动实现磁带的拆卸和装填(就像人手一样,拿出磁带放入磁带机)。它能够提供同样的基本 自动备份数据恢复功能,并且可以多个 驱动器并行工作,也可以几个驱动器指向 不同的服务器来做备份,存储容量达到 PB级,可实现连续备份、自动搜索磁带等功能,可在 应用层 管理软件的支持下实现智能恢复、实时监控和统计,可以说大型 数据备份的主要设备。
虚拟带库VTL(Virtual Tape Library  )
       说到磁带的时候提到过,磁带做离线备份的原因之一是因为大数据量存储,磁带与硬盘的性价比高。磁带机与磁带库是很昂贵的,但同样20T以上的数据量来看磁带还是比硬盘要便宜。那么随着硬盘 价格的不断下降,业内也在寻找一种硬盘替代磁带的方法,毕竟磁带虽然比较实惠,但其 保存环境较为严格,而且要是摔一下基本上不能用了。这个时候,虚拟带库就产生了, 带库两个字指的就是磁带库,而虚拟二字指的是 虚拟出来的磁带库!也就是说是以其它存储设备做 实际数据存放,但 存储方式是磁带库的备份方式。最开始的时候虚拟带库,是将盘阵与服务器 直连,在应用层安装 虚拟带库软件,将盘阵 虚拟成磁带库设备,那么在应用层备份软件中所 认到的设备就不是盘阵而是磁带库;后来随着 IP SAN的应用,发展成虚拟带库的独立设备,将虚拟带库的软件写入到盘阵或其它非磁带设备的电路板 芯片中,让其它自身提供虚拟磁带库工作模式,而不倚赖于应用层可自成一体。但虚拟带库有一个天然 缺馅,既然是将盘阵做当底层存储设备,那么不能像磁带那样将磁盘取出,虚拟环境看到的是取出,但其实没有。除非虚拟带库 连接真实磁带库才能做真正地底层设备离线。

小提一句:
       本来关于存储分类说到磁带设备应该就说完了,但最近我突然发现一个做离线的设备用的是虚拟带库的工作方式,可以做到将硬盘像磁带那样 弹出,底层设备也能做到离线二字。特意在结尾小提一句,这个设备叫做 RDXA8:
       这个设备有 8个槽位,里面插入的是笔记本硬盘,只不过外边有一层扛摔的外壳,是 SATA接口。设备的工作模式之一就可以提供 虚拟带库的工作方式,虚拟出8个磁带卡槽、 机器手,但磁带机只能虚拟出 个,可见是做 小数据量离线备份用的。
 
好了,长出一口气,这篇博客可算写完了,呵呵。我算了算时间,从 2013年4月13日早上11点开始写,一直写到了。。。。现在是 2013年4月14日14点34分,基本上用了一个工作日的时间。 硬盘到存储设备的产生,再到 设备接口与应用硬件环境,最后是 存储设备分类,将整个历史源流疏理一遍。其实有很多没说清楚,像硬盘的各种接口、存储设备实际在工作时的数据走向流程,比较深挖的东西没有说到,还有像网络光纤与存储光纤的驱别种类这些也算是没说到的。但初衷还算达到了,我本来想整理的就是存储设备的源流,还是偏硬件一些;以后有机会会把这篇中提到的很多知识点细化再编写成文。有这方面的高手欢迎指点,余当虚心求教之,谢谢~!