分析与挖掘的数据类型
数据的常见形式有数据库数据,数据仓库数据,事务数据等。
数据库数据
数据库系统(DBS)是由一组内部相关的数据(称为数据库)和用于管理这些数据的程序组成,通过软件程序对数据进行高效的存储和管理并发、共享或分布式访问,当系统发生故障时,数据库系统应当保证数据的完整性和安全性。
数据仓库数据
数据数据清理、数据变换、数据集成、数据装入和定期数据刷新构造。
数据库的数据组织是面向任务的,而数据仓库中的数据则是按照主题进行组织的。主题是指决策者进行决策时所关心的重点内容。
事务数据
事务数据库中的每个记录代表一个事物,例如一个车次的订票,顾客的一个订单等。
通常来说,一个事物由一个唯一的标识号和一组描述事务的项组成 ,有时也需要一些附加信息表示事物的其他信息,如对商品的描述等。
数据矩阵
在一个数据集中,如果数据对象的所有属性都是具有相同性质的数值型数据,那么这个数据集就可以用矩阵来表示。
通过将每个数据对象映射到多维空间中的点或向量,可以根据数据对象的空间位置关系进行分类和聚类操作。
图和网状数据
图和网状结构通常用来表示不同节点之间的联系。