数字化时代,每个人每天都要接触大量的数据。人们通过分析数据获取信息与知识,帮助自身更好地理解社会动向,掌握行业发展。我们每天都会接触到多种多样的数据,这些数据根据结构可划分为三种:结构化数据、非结构化数据和半结构化数据。
数据的结构化分类
结构化数据
结构化数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。结构化数据的存储和排列是很有规律的,一般特点是:数据以行为单位,一行数据表示一个实体信息,每一行数据的属性是相同的;能够用数据或统一的结构加以表示,如数字、符号;能够用二维表结构来实现逻辑表达。典型的结构化数据包括:信用卡号码、日期、财务金额、电话号码、地址、产品名称等。
半结构化数据
半结构化数据是结构化数据的一种形式,它并不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,能够用来分隔语义元素以及对记录和字段进行分层,数据的结构和内容混在一起,没有明显的区分,因此,它也被称为自描述的结构,简单的说半结构化数据就是介于完全结构化数据和完全无结构数据之间的数据。结构化数据通常是先有结构再有数据,而半结构化数据则是先有数据再有结构。
非结构化数据
非结构化数据是数据结构