01 数据是一组有意义的符号
数据无处不在,只是它们没有实体。
过去,人们习惯把数字的组合称为数据。但在今天,这样的理解显然不够全面。那么是否可以把数字、字符、字母的集合称为数据?也不准确。
在今天“大数据”的语境中,数据是可以被记录和识别的一组有意义的符号,一般可通过原始的观察或度量得到。数据是对客观事物的逻辑归纳,可以用来表示一个事实、一种状态、一个实体的特征,或一个观察的结果,有些是用于描述某个对象的事实性数据,有些则是通过观察、分析、归纳得到的总结性数据。
数据可以是连续的,比如无线电通信时在空气中传输的电磁波,它们是模拟数据;数据也可以是离散的,比如在计算机中存储的文档和照片,它们是数字数据。
承载数据的形式有很多,不仅包括文字、数字、符号、图像、语音、视频,也可以是对某个事物的属性、数量、位置、关系的抽象表示。大气的温湿度、汽车的行驶路线、学生的档案记录、商务的合同,这些都是数据。
我们平时用电子设备看新闻、拍照片、买东西、打游戏,本质上都是在和数据打交道。在计算机中,它们是一连串包含有0和1的二进制数的组合。