深入理解信息科学中三条“数据法则”

        通过上一章的阅读,我清楚地认识到了物理、生物和数字世界的区别和联系,从而更深层次地明白了三个世界之间的结合与共同作用,极大程度上拓宽了人类的生存空间与发展未来前景,推动着人类文明的向前与科技的进步。不仅如此,数据在其中地作用也是不可或缺的。以数据为驱动的信息革命使知识的生产成为主要的生产形式,知识成了创造财富的主要资源。以数据为驱动,使信息的传输速度,传输的信息量相较于工业革命时代有了较大飞跃,大大加速了全球化的进程。到底数据是怎样在其中发挥作用并且推动社会进步呢?本章就是围绕数据法则来展开的。

        在谈论数据法则之前,我们先对数据的进行了一定的了解。数据可以被定义为反映、记录和展现事物存在及变化的符号。我认为这是较为合理的科学定义。因为数据按性质分类可以分为表示定位数据,定性数据,定量数据,定时数据等。各种类型的数据存在于物理,生物与数字世界中,反应着物理规律与存在的事物变化。如各种物理规律的证明与表达需要依靠数据来实现,再如不管是疫情时期的科学防控,统一部署无不依赖着统计数据等。其中的疫情趋势的预测更是依靠着相似的数据模型计算得到,与实际情况达到几乎吻合。可以说数据很好地达到了对事物及其变化预测的目的。而如果将数据定义为反映、记录和展现物理和生物世界的符号,我认为则不够全面。数据不仅在物理和生物世界里进行交换与表达,也在数字世界中起着至关重要的作用。因为作为“三个世界”理论中的数字世界,它的存在方式也是以数据为主要元素构成的。大到经济的运营小到芯片的研发,数据始终是每一个过程的参与者与贡献者。并且世界上的数据大多数都可以被表示为数字数据,数据可以进行数字化变化,例如可以通过十进制到二进制的转化,可以将量化后的信号再转为数字信号。

        在科学数据第一法则的表述中,第一法则被定义为“世界上任何事物均可以被数据化,即客观世界的存在与变化均可被抽象表达为某种符号。任何数据均可以数字比特的方式表述、记录和处理,即世界上的任何事物均可以被数据化,即可被映射到一个虚拟空间表达为某种符号。”数据科学第一法则认为客观世界可以由某种数据系统映射为某种符号,这种符号与所反映的事物的关系有很多种。 首先,这种关系可能是显性关系。比如某些人工的数据系统,它在人类的科技发展与进步中起到了重要的作用,正是因为人工数据系统,使世界中被数据化的事物可以自发地产生,存在,运动并且发挥作用。他们在发展中逐渐与自然地生物数据系统共存发展,使数据系统更加完善。在信息革命中更是增长飞速,使数字世界爆炸性增长。在显性数据中又可以分为直接数据和间接数据。比如某个城镇的面积数据,某条河流的长度数据,某个飞机的速度数据,某种棉花的量产数据等等,这些实在的事物均可以被直接地记录为各种的数据,通过数据使这些事物全面具体地被映射。这些数据并不需要经过各种复杂地处理就可以直接记录为某种数据。除此之外,这种关系可能也是间接的关系,即不可以被直接地表示出来,需要经过一系列各式各样地变化才能被记录,映射,呈现。例如声波的采样与转换为电信号,生物电流的模拟与记录等,这些事物需要一定的运算变化才可以被以某种方法记录下来。而隐性关系则是生物处理系统这些平时不能直接感知得到的,它们不易被人们所察觉却又在生物的进化与发展之中进行着事物的映射的功效。

        数据科学第二法则是指:“数据的存在和运动必须依赖于某种物质和消耗一定的能量,并遵循相应的物理规律。”这条法则主要是针对数据的存在与运动的规律提出的。数据的传播与交换并不是无拘无束的,不需要条件的,事实上它需要凭借物质作为媒介来达到目的,除此之外,还需要能量作为动力来推动整个过程的产生与持续。那么数据所映射的现实中的实在事物也就必然需要物质与能量,并且始终遵守着物理规律。例如电磁波是由同向且互相垂直的电场与磁场在空间中衍生发射的震荡粒子波,是以波动的形式传播的电磁场。而场就是一种物质。再入今天的信息时代中,各种数据更是离不开光盘,u盘,硬盘等电子类型的设备储存,哪怕云盘等储存也离不开服务器的支持。这些载体也都是客观实在的事物,就必然遵守物理的规律。在科学发展的过程中,有许多科学家用了多种实验来证明,得到的结果为:即使处于最理想的极限情况,对于数据的处理仍然需要消耗能量。虽然科学发展非常迅速,科学理论非常完备,但总有人认为社会中总有一些现象似乎不需要物质与能量。比如所谓的精神,灵魂,超自然的神学等等,以现在的科学暂时无法合理解释的超物质或现象。这也需要我们对于物理与科技的进一步探索才能发现其中的真相。但许多科幻小说家已经就这种超物质进行了一定的预测与大胆的假设,例如著名科幻小说作家刘慈欣就在他的小说《球状闪电》中就用假设的方法对灵魂做出了解释。再者由长辈们口口相传的经验或者谚语,看似没有经过物理的载体,但如果研究就会发现,这些信息储存在大脑里,而大脑中与记忆相关的细胞与神经也需要消耗一定的能量来保证功能的正常作用,并且它们也受物理定律的影响。这也从侧面证明了数据科学第二法则的正确性与其价值。

        不仅如此,数据科学第二法则的另一个实际需要考虑的应用就是如何降低数据比特需要消耗的物质与能量。找到数据的传递过程中所需要的物理与能量的极限,最终趋向于其物理层面上真正意义的极限。而作为电子信息的基石,处理数据的各种载体也在不断地更新,从最开始的由电磁感应来控制的开关继电器,到后来的真空电子管,再到半导体晶体管,以及集成电路的研发。针对芯片上集成的晶体管数目,科学家们又提出了“摩尔定律”。

(摩尔定律)

        并基于这个定律形成了“登纳德缩放定律”。在登纳德定律失效后,主要延续摩尔定律所采用的缩小晶体管尺寸的努力与创新,集中在三个方面,分别是改进光刻技术、改进晶体管的材料和结构、减少缩小尺寸的负面影响,如功耗增加等。这与数据科学第二法则所要应用的方向非常符合。整个数字系统的功能和各方面的性能将会随着单个比特的能量和物质的减少指数上升。晶体管开关的速度也有最终极限,要提高开关的速度,就要减少特征尺寸以及晶体管源到漏极沟道的长度,长度越短,电子输运的时间就越短。但同时也会增加泄漏电流而引起静态功耗。另外,栅极与沟道之间的接触面积减少也会影响栅极对电流的控制。所以,当降低栅极电压到约为1V和沟道长度约20nm时,造成的功耗增加超出了芯片和系统热管理的极限,晶体管开关速度不能再继续增加。 我们也期待着这种瓶颈的突破。

        数据科学的第三法则可以表述为:数据是协助人与人、人与机以及机与机之间相互作用的媒介,也是人类和智能系统认识和改造世界的工具。这第三法则在现在的信息时代中应用颇深,数据之间的交换变得越来越频繁。随着越来越多基于数据的技术产生并且应用于现实生活中,我们对于物质和能量的处理也在不断提升,数据使我们与客观世界的联系更加紧密,它就像其中的媒介与工具。例如,可以通过数据的收集等各种手段,采集到足够多的数据作为大数据的数据库,再对这些数据进行统一的建模处理,便可对每一类的人有一个准确的三维坐标点,点离的越近的人就会越相似,根据这种数据的分析便可以很轻易的给某个人以精准的人物画像,而企业更会通过这种方式快速的了解一个人的各种方面,并对他采用相应的信息推送或者产品的销售。这种个性化的服务也会让用户消费者对企业产品产生依赖,无形之间完成了人与人之间的相互作用。人与机之间也会通过数据进行相互作用,例如物联网一类的工程,借助各种信息传感器、射频识别技术、全球定位系统、红外感应器、激光扫描器等各种装置与技术,实时采集任何需要监控、连接、互动的物体或过程,采集其声、光、热、电、力学、化学、生物、位置等各种需要的信息,化作数据,通过各类可能的网络接入,实现物与物、物与人的泛在连接,实现对物品和过程的智能化感知、识别和管理。这使人机之间的相互作用变得更加直接且有效。再如机器学习,深度学习等项目,更是通过大量数据的交换来训练机器的智能处理数据的能力,并在此基础上进行模仿学习,以通过图灵测试。

        数据科学第三法则还认为人类发展有“虚拟化”趋势,就是随着产生、接收和处理的数据量增加,人类个体和社会的生命和生活将被数据化,最终产生一个高度数据化的自己和数据化世界。那时的数字世界将会给人类带来更大的空间和更多的自由。毫无疑问,数字世界将会为我们带来更多的可能性,比如近些年兴起的移动支付,则是通过数字世界,将货币数据化。随着它的推广与普及,移动支付给与了人们支付方式上的巨大变革,它赋予了人们更多的支付自由。在将来,人的各项数据可能都会被记录并且分析,如情绪,人生经历等数据,这样数据可能使古人与后人进行跨越时空层面的对话与了解。再某种意义上给了人们更多的长久存在的自由。

        物理和数字空间均为人类活动的空间。不同的是物理世界中的事物的客观存在一定程度上受种种因素的限制,例如时间或者空间上的限制。而数字世界则不会受上述各种因素的约束,人们可以再数字世界中跨越距离地交流,人们可以在几乎无限的空间中可以发挥自己的创造力,使数字世界更加的丰富,同时当数据量到达一定程度后,数字世界将愈发地真实与广阔。人类将更多地进入由数据构成的数字世界,极大程度上拓宽了人们的生存空间。

        通过本章对于数据科学三法则的深入学习,让我可以从不同的视角看待数据以及“三个世界”。科学数据三法则分别从数据的定义,数据的存在与运动,数据的作用三个层面来全面细致地描述了数据。越来越多的数据的产生与交换将会带来科技方面的机遇与进步,同时也会重新定义未来的世界。

参考文献:

黄卫平. 数据智能科学技术导论[M].北京:清华大学出版社,1-274.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

timerring

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值