第二章、表格结构数据与表数据(1)
一、数据概述
1、数据类别
结构化数据:数据结构规范、完整的数据。主要产生于企业的业务系统及客户端的应用程序。
非结构化数据:数据结构不完整、不规范、格式多样、难以理解、难以进行标准化处理的数据。主要来自企业系统之外的数据,大部分都属于非结构化的数据。
结构化数据与非结构化数据成为大数据时代背景下的数据主体。
2、结构化数据分类
根据对结构化数据进行加上共处理、分析、展现多使用的IT工具的不同,
结构化数据又可以分为表格结构数据、表结构数据两类。
(1)表格结构数据:通过EXCEL等电子表格工具进行数据分析时,以单元格作为数据加工、处理、分析的基本单位的结构化数据。
(2)表结构数据:在通过数据库或ELT工具进行数据分析时,以字段作为数据加工、处理、分析的基本单位的结构化数据。
二、表格结构数据
1、表格结构数据特征
(1)表格结构的基本概念
用于对表格结构数据进行识别、引用、计算的基本单位叫单元格。
单元格的集合叫做单元格区域。
单元格区域的集合叫做工作表。
工作表的集合叫做工作簿。
一个工作簿就是一个独立的电子表格文件。
(2)表格结构的数据类型
在表格结构数据中可以为不同的单元格设置不同的数据类型。
但是一次只能为一个单元格设置一种数据类型。
数据类型是计算机识别、计算数据时参照的依据,计算机会为不同数据类型的数据保留不同长度的内存空间并按不同方法对其进行引用计算。
在表格结构数据中,主要的数据类型可分为数值型、文本型、逻辑性三类
数值值包含整数值