在 iteye.com这个中国最优秀的技术交流社区已经很久了,从中学到了不少东西,得到了不少体会。从今天开始决定写自己的博客。
数据仓库概念创始人W.H.Inmon在《建立数据仓库》一书中对数据仓库的定义是:数据仓库就是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程、数据仓库中的数据面向主题,与传统数据库面向应用相对应。
数据仓库存储海量的数据,从这些数据中抽取有价值的信息和数据,提高企业的经营分析,制定决策是具有指导和参考的价值,以及工作效率的提高。从这些数据中提取信息,就要用到数据挖掘技术,数据挖掘技术的水平如何,直接决定了从数据仓库提取信息数据的价值性和参考性。
数据仓库至今还是用关系数据库管理系统来管理其中的数据。从关系数据库中获取数据,需要用到ETL(数据抽取系统)技术,该技术的架构如何,直接决定从关系数据库的海量数据转到数据仓库中的效率,以及实际操作的工作效率,比如银行的取款和存款业务,需要用到流水帐号信息的存储,需要把每天的大量的业务交易信息存储到持久地存储设备上,而数据仓库技术的架构如何,对存储的效率至关重要,毕竟银行的数据是海量,上万或上亿的海量数据。
数据仓库技术有待研究和发展。特别数据挖掘技术的发展,会提高抽取数据的质量。