微软的BI解决方案由一系列的组件构成:
SSIS(SQL Server Integration Service)
SSIS是一个ETL工具。一个BI项目面临的第一个问题就是如何将多个异构数据源的数据整合到一起,这也是SSIS解决的第一个问题。SSIS可以很方便的从FTP,普通txt文件,access 等数据源读取数据,并将数据整合到一个统一的地方(通常是关系型数据库)。
SQL Server关系型数据库
在BI中,关系型数据库常常用于建立数据仓库和数据集市。关于数据仓库和数据集市的概念和区别,请参考:
http://blog.csdn.net/vertour/article/details/8508148
由于建立数控仓库和数据集市会涉及数据清洗,转换等过程(这个过程也称为ETL),也需要一个组件来完成,由上文可知一般由SSIS来完成。SSIS可以直接连接到关系型数据库,运行SQL或调用存储过程等,完成ETL过程。因此,关系型数据库为数据存储工具,SSIS为ETL工具。
SSAS(SQL Server Analysis Services)
数据仓库中的数据组织形式通常符合第三范式,而数据集市中的数据组织形式则一