先理解几个概念
商业智能(Business Intelligence BI)
企业数据仓库(Enterprise Data Warehouse EDW)
数据仓库(Data Warehouse DW)
数据集市(Datamart)
数据挖掘(Data Mining)
这是BI领域几个基本的名词.
比较认同BI是所有相关系统汇合形成的最高层次的统称,包括EDW,DSS(决策支持系统),Datamart,Data Mining等等.
对这个统称,不同的组织内部称呼可能不一样,有的直接叫DW或DW系统,ODS,还有BW(SAP的,Business Warehouse),信息工厂CIF(Corporate Information Factory)等.
最开始接触BI这一概念是在09年初,当时用SSRS做报表,这是Microsoft SQL SERVER BI solution中的一个组件,用来做定制化报表与随机查询报表的工具.另外的组件有SSIS,集成的界面操作型ETL工具;还有SSAS,用来设计OLAP数据库与分析.
Kimball的<<数据仓库工具箱>>就是基于Microsoft SQL SERVER BI solution写的.个人所认同的BI/DW理念就是缘于这本书.
BI是一种解决方案,像ERP,CRM,ITIL等等一样,都是IT为企业或组织提供的一种计算机服务.
BI的基础与核心是数据仓库.
数据仓库是一种结构,理解成一种组织企业数据的方式.而不是一种技术,虽然需要各种各样的技术.这个是数据仓库之父Inmon的著作<<构建数据仓库>>这一书中,最让印象深刻的概念.就好比你电脑上有各种各样的文件,通过适当的分类,归纳,建立合适的文件夹,再将文件放进去.这样条理清晰,能很快找到你所需要的内容.
Inmon 和 Kimball 分别代表了两种不同构建DW结构的方法,明细后续再说.
任何新兴领域到了一定的程度,都会有人立言立说,奠定理论基础,制定标准.毕竟规范化是提高效率,降低成本最有效的途径.