数据分析与挖掘的数据类型
- 数据库数据
- 数据仓库数据
- 事务数据
- 数据矩阵
- 图和网状数据
- 其他类型的数据
1.数据库数据
- 数据库系统(DataBase System,DBS)由一组内部相关的数据(称作数据库)和用于管理这些数据的程序组成,通过软件程序对数据进行高效的存储和管理。
关系型数据库:- 基于关系数据库模型
- 数据表的集合
关系查询语句SQL(Structured Query Language),结构化查询语言
数据属性、数据实体及关键字
选择、投影、连接
2.事务数据
3.数据仓库数据
数据仓库(Data Warehouse,DW)是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理者决策过程。
- 数据清洗
- 数据变换
- 数据集成
- 数据装入
- 数据刷新
数据仓库使用数据立方体的多维数据结构建模,其中每个维度包含模式中的一个或一组属性,而每个单元保存对应的属性值。
4.数据矩阵
数据矩阵中的数据对象的所有属性都是具有相同性质的数值型数据。
对文档的分类(文档-关键字矩阵)
5.图和网状数据
图和网状数据通常用来表达不同节点之间的联系,比如人际关系网、网站之间的相互链接关系等。
- 网页排名算法 PageRank
6.其他类型数据
- 与时间相关的序列数据:不同时刻的气温、股票市场的历史交易数据
- 数据流数据:监控中的视频数据
- 多媒体数据:视频、音频、文本和图像数据