硅谷之思:数据的永生

你知道下面的9个数有什么含义吗? 第四行的3个数字应该是什么?

 

1

4

1

5

9

2

6

5

3

……



 

先按下不表,答案在文章末尾。

 

前几天去了VMware总部,总部位于Palo Alto,大概有十几栋楼,楼层不高只有两层,面积很大,像极了公园,非常漂亮。出差完后,顺便去参观了同在Palo Alto的Computer History Museum(计算机历史博物馆),展厅的标题是Revolution - The First 2000 Years of Computing,进入后赫然在目的就有中国的算盘。



参观花了我一整天的时间,直到晚上闭馆,按照我的节奏,看两天都不成问题: )  感慨颇多,下面仅就存储方面进行分享。


下图是古人存储数据的一种手段:结绳记事。

 


 

再往后,壁画、写有文字或图案的竹简、丝绸、皮革、纸张、书本、容器、石碑等成为了存储介质。

 

进入到计算机时代,也即1940~1950年代间,磁鼓出现。下图就是Magnetic Drum(磁鼓)。

 



后来相继出现了磁带(含录音带)、磁盘(含软盘、硬盘、ZIP盘)、胶卷、光盘和闪存盘等。下图是世界上第一个磁盘,1956年IBM生产的,50个24寸 1200转,总共能存放500万个字符。大致每块盘存放100KB信息。


 

下图包含了软盘、磁带、光盘等。

 

下图包含了硬盘、10GBiPod、1GB SANDisk Memory Disk,还有在1999年IBM就生产出来的1寸Microdrive,是专为消费类产品数码相机研制的,能提供几个GB的空间。它很快就被闪存取代。

 

 

不过令我深思的是展板上的一句话: If your data were stored on one of these, how would you readit?

 

 

是啊,就算是这些存储介质保存的完好如初,它上面的数据能被读出来吗? 如果不能读出来,这些数据,以及数据存放的存储介质,除了纪念收藏参观以外,就毫无意义了。

 

怎么办呢?

 

在人类的历史长河里,例如结绳记事,象形文字,甲骨文字,除了它们自己的流传,我们还需要能读懂这些数据的语言能代代相传下来


在计算机时代,以及未来较短的时期里,首先需要保证的是数据的流动,因为原有格式的数据所存放的存储介质很有可能在就10~20年内就过时了。例如,你还在使用光盘、软盘或者录音带吗?


举个真实的例子,我曾经有一个亲戚,手里有一九九几年用摄像机拍摄的录像带,问我能不能帮忙导出来。这其实是一个不容易的事情,好在后来,我在广电行业的朋友找到设备能够读出来,这样才得以挽救这些弥足珍贵的影像数据。我们在十几年前甚至几十年前的照片,也需要数字化,才能方便使用,并避免消失。

 

谈到数据的流动,令我想起了2009年或者2010年我在美国明尼苏达参加Compellent年会时的感受,当时公司市场部第一次用水流来比喻数据的流动,并且在四周的墙壁上贴了一些对比图,例如表示流动的李小龙,和表示僵化的英国女王。并引用了李小龙这位既是武术大师,同时又是哲学家的一段话,功夫像水一样(大意如此,原文记不住了)


打开文章《大学主修哲学的李小龙链接,观看第2个视频“功夫哲学 - Be Water”。

 

虽然我那时候已经意识到Fluid Data(流动的数据)不过是公司市场宣传的新手法,但看到上面的视频时,仍然觉得激动、震撼。好不容易找到了这段视频,分享给大家看看,你们觉得是不是很酷?


class="video_iframe" data-vidtype="1" allowfullscreen frameborder="0" style=" z-index:1; " height="417" width="556" data-src="https://v.qq.com/iframe/preview.html?vid=q03918ishrz&width=500&height=375&auto=0">


看看Compellent下面的这些广告词,是不是用在VMware vSAN也非常贴切 : )

 

数据是流动的:智能的,灵活的,安全的,方便的

数据能够根据其自身的重要性,流动到相应的位置

数据能够根据系统的需求,自动地延伸

数据能够让你花费更少的时间来管理

数据总是能被安全的保护并恢复

数据不是被动存放的,它是动态地智能地为业务应用随需响应

 

 流动的世界,流动的数据

 


用流动的数据来阐述Compellent(现属于DELL公司)的自动分级功能,我个人觉得,这比早在2003年以前由老牌存储公司StorageTek(后被SUN收购)提出,后来经由EMC发扬光大的ILM(InformationLifecycle Management,信息生命周期管理)更形象更深刻。

 

数据能够根据其自身的重要性,流动到相应的位置,对于的具体存储技术有数据缓存、自动分层、归档、卷迁移等,从广义来说,克隆、备份、容灾等,凡是涉及到数据形态和位置的变化都可以说是数据的流动。

 

然而,数据的流动,只是解决了数据与其存放位置的耦合。但是读懂这些数据的“语言环境(简称语境)”,也需要随之流动,这就是与之相关的操作系统或应用软件。需要注意的是,有时因为操作系统或应用软件的版本变化,也可能导致数据不能顺畅地被读取。

 

数据及其“语境”一起流动,对应的不就是类似VMware vMotion(虚机)和Storage vMotion(vmdk)的技术吗?  唯有一起流动,才能不受存储介质的硬件生命周期的束缚,更长久地更放心地使用。唯有在线流动,才能满足移动互联网和大数据时代环境下,对于业务及时响应的需要。

 

进一步,数据及其“语境”的流动,能在更大的范围内实现吗?

 

其实,借助于VMware的Cloud Foundation和跨云战略,就能实现本地数据中心(或叫做私有云)和不同品牌的公有云之间的流动,这样为用户不被某个单一的公有云厂商锁定,打破孤岛,奠定了基础。从技术上来看,目前要实现在线流动,需要同构的虚拟化层(Hypervisor),这也是IBM Cloud、AWS和VMware合作的原因之一。今年,AWS基于VMware Cloud Foundation(包含VMware 软件定义的数据中心的整套软件堆栈,含vSphere、vSAN、NSX、vRealize和SDDC Manager)的云计算平台将会面市。顺便说一句,我一直觉得,VMware确定的混合云管理的跨云战略是IT的一件大事。

 

 

当然,这篇文章里所提到的vMotion、Cross Cloud只是探讨一种比较可行的方法。欢迎你通过留言,提出其他方法,或者提问引发大家更多的思考。

 

现在回答一下文章开头提出的问题,下表其实表示的是:

Pi(圆周率)-3的差的近似值0.141592653……,你猜对了吗?

 

1

4

1

5

9

2

6

5

3

……



 

所以,光有数据的保存和流动还不够,还需要有语境。如果语境是所处地域里人所共知的,精确地,则可以无需语境随之流动。如果不是,还有一种方法,就是让数据和语境产生关联,从而使数据获得语境的解读。

 

如果想得更远一些,数据现在使用的存储介质,三五十年后终将淘汰,在那之后呢? 或许放在云上,能够延长它的生命周期,但是一百年后呢?

 

旅行者1号把一些声音和影像放到唱片里,但是这些唱片怎么被读出呢?  外星人获取后,会知道怎么操作吗?

 

欢迎留言各抒己见。

 

【备注】

    2006年,美国国家航空航天局将旅行者1号发射到太空中,旅行者1号携带了一张铜质磁盘唱片,它有12英寸厚,镀金表面,内藏金刚石留声机针。这意味着即使是十亿年之后,这张唱片的音质依然和新的一样。

      这些数据旨在向“外星人”表达人类的问候。55种人类语言中包括了古代美索不达米亚阿卡得语等非常冷僻的语言,以及四种中国的方言(普通话、闽南语、粤语、吴语)。各个问候语的表述句子全部不一样。

 

    唱片内还包括一个90分钟的声乐集锦,主要包括地球自然界的各种声音以及27首世界名曲,其中有中国古曲《高山流水》、莫扎特的《魔笛》和日本的尺八曲等。一共有115幅影像,太阳系各行星的图片、人类生殖器官图像及说明等。另外,唱片封套上也包括了一块高纯度的铀238。

用什么方式能够让外星人理解我们的“语境”?

 


总之,数据的永生,不仅是指数据自身,还有读懂这些数据的语境,也要永生



--End---


微信公众号平台"乐生活与爱IT"在目前阶段,主要是分享软件定义存储(SDS),及VMware VSAN相关的文章,偶尔也会分享虚拟化、云计算、大数据,甚至生活类的好文章。欢迎投稿,我的QQ号:9269216欢迎对SDS感兴趣的朋友,加入软件定义存储讨论 QQ群:122295009,可下载原创的一些文章,及其他有参考价值的文档。可直接搜索群号,或者扫描如下二维码:


同时,欢迎您加入 "开放讨论群-SDS&虚拟化" 微信群,并邀请其他对SDS和虚拟化感兴趣的朋友加入此微信群。可以通过添加如下管理员之一的微信号,建议添加管理员时,告知你的公司名和姓名,方便备注保存。

sdg8848

libo9538

yangzhuan

dts0103

欢迎您通过扫描关注微信公众号:“乐生活与爱IT”。


关注后,可以通过点击左下角的文章目录,通过输入三位数(记住!是三位数,目前第一位是0或者1)详细了解如何查看历史文章。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值