从结绳记事到数字资源长期保存(上)

我们生活在一个信息爆炸的大数据时代,2020年全球产生数据量已经超过40ZB,相当于地球上每个人每年产生了5TB的数据。

存储单位换算表

1B(Byte 字节)=8bit
1KB=1024B
1MB=1024KB
1GB=1024MB
1TB=1024GB
1PB=1024TB
1EB=1024PB
1ZB=1024EB=1.0×1021B

这些数据中,80%以上是不经常使用的“冷”数据,同时至少有10%的数据是有价值的数字资源,需要被长期保存。如何实现海量有价值数字资源的长期保存是一个世界性的难题,这一难题的背后,数据存储技术一直在默默的支撑着人类社会的进步发展,并且与我们的生活息息相关。

从最早应用于存储纺织行业图案的打孔纸卡,到后来用于调查人口时的信息存储,存储介质在历史的长河中也是不断的更迭演变。唱片、磁带、碟片的诞生,音乐和影视行业进入了大家的视野,风靡一时;半导体、硬盘、闪存等的出现,推进了信息时代的发展进步。今天,就让我们来了解一下数据存储的发展历史。

01

存储器

这得从结绳记事开始说起,结绳记事是远古时代人类为摆脱时空限制记录事实、进行传播的一种手段之一。它发生在语言产生以后、文字出现之前的漫长年代里。在一些部落里,为了把本部落的风俗传统和传说以及重大事件记录下来,流传下去,便用不同粗细的绳子,在上面结成不同距离的结,结又有大有小,每种结法、距离大小以及绳子粗细表示不同的意思,由专人(一般是酋长和巫师)循一定规则记录,并代代相传。

 从数据存储的角度去理解结绳记事,实际上是一种“存储器”。古人用结绳记事来帮助记忆,而存储器就是电子设备中用来保存信息的“记忆”设备,它具备存储数据和信息的能力,并且可以连续执行程序,进行广泛的信息处理。

在数字系统中,只要可以保存二进制数据的都可以称为存储器;在集成电路中,具有存储功能的电子元器件也称为存储器(如随机存取存储器RAM、只读存储器ROM);在系统中,具有实物形式的存储设备也叫存储器,如内存条、内存卡等。而存储器又可以分为内部存储器(内存)和外部存储器。本文主要和大家一起来探讨外部存储器。

我们可以对外部存储器中的数据进行读取和写入,外部存储器中的数据会一直存在,直到被覆盖或删除,断电也不会丢失,当然每种存储器都有寿命。比如U盘就是一种很常见的外部存储器,能低成本+可靠+便捷地存储上GB甚至几十GB的数据,因此常被用于个人数据交换或备份。

02

最早的存储介质-打孔纸卡

打孔纸卡又称穿孔卡、霍尔瑞斯式卡或IBM卡,是一块纸板在预先知道的位置利用打洞与不打洞来表示数字消息。早期的数字电脑运用打孔机已输入信息的打孔卡作为计算机程序和数据的主要输入介质。

 1801年,法国人约瑟夫·玛丽·雅卡尔发明了打孔卡,当时用在控制织布机织出的图案。1880年代,美国人口调查局职员赫尔曼·何乐礼发明了用于人口普查数据的穿孔卡片及打孔卡片制表机,并于 1888 年申请了第一个专利权。在1890年美国人口普查中,通过打孔制片和打孔机,仅6周就完成了统计,而此前1880年美国人口普查的数据全靠手工处理,历时7年才得出最终结果。

何乐礼发明的打孔卡片制表机,是电脑的前身;他当时创建的制表公司,就是今天蓝色巨人IBM的前身。

一个程序少说也有几百上千条指令,在纸带上穿孔后纸带足有好几米长,没有个三五天是穿不完的。到了20世纪,打孔卡应用在单位记录机作为输入端、处理和计算机程序。到1940年代,纸卡标准是 80列×12行,一张卡能存 960 位数据。据我们所知的最大纸卡程序是美国军方的“半自动地面防空系统”(简称SAGE),一个在1958年投入使用的防空系统,主程序存储在62,500个纸卡上,大小5MB左右。

但其实打孔纸卡我们每个人几乎都用过,只不过是革新之后的形式——答题卡。早期的答题卡和穿孔纸带很像,也是采取穿孔方式:阅卷时,每一个答案的选项位置都会有一个金属棒对应,如果答案是正确的,金属帮就会从答题纸的孔穿下去;如果答案错误,金属棒就穿不下去。最终根据答题纸的称量结果换算出得分。

 改进之后的答题卡使用石墨填涂对应位置,然后用一束光扫描答题卡,因为石墨的特性是只会吸收和反射光线,而不会让光线透过它,被涂写的部分就会向外反射出光线。在反射出的方向上有捕捉光线的传感器,答卷数据就会被系统获取并计算出得分。

除了作为答题卡很实用,打孔卡纸作为存储介质,因为不用电而且便宜耐用,被持续使用了十多年。但它的缺点也很明显,就是存储容量小,读取速度慢,并且只能写入一次,打的孔无法轻易补上,对于存储经常发生变化的临时值,纸卡不好用,所以大家开始寻找更快更大更灵活的存储方式。

03

存储介质的发展史

1944年,宾夕法尼亚大学的J. Presper Eckert发明了“延迟线存储器”。原理如下,拿一个管子装满液体,如水银,管子一端放扬声器,另一端放麦克风,扬声器发出脉冲时会产生压力波,压力波需要时间传播到另一端的麦克风,麦克风将压力波转换回电信号。

 

这个延迟线存储器的原理,就是通过用压力波的传播延迟来存储数据。有压力波代表1,没有代表0。通过内部电路连接麦克风和扬声器,再通过放大器来弥补信号衰弱,从而实现一个存储数据的循环。研究出这个技术之后,Eckert和同事John Mauchly使用延迟线存储器做了一个更大更好的计算机叫 EDVAC,总共用了128条延迟线,每条能存352 bits,总共能存45,000 bits,这也是最早的“存储程序计算机”之一。

但“延迟线存储器”也有一个很大的缺点:每一个时刻只能读一位 (bit) 数据,并且只能顺序读取,所以又叫“顺序存储器”或者“循环存储器”。因为这个原因,延迟线存储器在1950年代中期就基本过时了。一项新的、性能和可靠性更高、成本更低的存储技术——磁芯存储器——应运而生。

给磁芯绕上电线,并施加电流,可以将磁化在一个方向,如果关掉电流,磁芯保持磁化;如果沿相反方向施加电流,磁化的方向(极性)会翻转,这样就可以用来区别存储 1 和 0。

通过把磁芯排列成网格,由电线来负责遴选行和列,同时也将电线贯穿每个磁芯, 用于读写一位(bit)。

磁芯内存的第一次大规模运用是 1953 年麻省理工学院的Whirlwind 1计算机,磁芯排列是 32×32,用了16块板子,能存储大约16000 bits。更重要的是,不像延迟线存储器,磁芯存储器能随时访问任何一位(bit),这在当时非常了不起。

磁芯存储器从1950年代中期开始成为主流,流行了20多年。但因为工艺问题,一般是用手工编织制作,所以成本较高,大约1美元1位(bit) 。到1970年代,通过技术革新才下降到1美分左右。不过即使每位1美分也很贵,现在我们的手机随便拍张照片都有10多MB,约等于8000万bit,你愿意花80万美元存一张照片吗?

同期,1951年Eckert和Mauchly创立了自己的公司,设计了一台叫UNIVAC的新电脑,是最早进行商业销售的电脑之一,它推出了一种新存储:磁带。

磁带是纤薄柔软的一长条磁性带子卷在轴上,磁带可以在“磁带驱动器”内前后移动,里面有一个“写头”绕了电线,电流通过产生磁场,导致磁带的一小部分被磁化,电流方向决定了极性,代表 1 和 0。

 

还有一个“读头”,可以非破坏性地检测极性。UNIVAC用了半英寸宽,8条并行的磁带,磁带每英寸可存128位数据,每卷有1200英尺长,意味着一共可以存1500万bits左右,接近2MB。经过不断的优化,提高密度、缩小尺寸、降低单位存储成本,直到1980年代磁带才被广泛应用。由于磁带是循序存取的装置,尤为适合传统的存储和备份以及顺序读写大量资料的使用场景。但因为速度较慢,且体积较大等缺点,现在主要仅用作商业备份等用途。

1950、60年代,有个类似磁带的技术是“磁鼓存储器”,它是如何产生的?是怎样的原理?相较于上一时期的磁带,外观是否有改进?

精彩待续... ...

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值