构建简单的BI应用
1、要从业务数据出发设计数据仓库的结构,必须明确业务数据本身的结构,而业务数据的关系一般是基于关系数据库设计的范式。
数据仓库中的表的关系不受关系数据库设计范式的约束,但也要遵循一定的结构规范,如星形结构和雪花形结构即是这种类型
的规范。同事这也是数据仓库逻辑结构的两种类型。
2、在数据仓库的逻辑结构中,数据表可分为两类:一类是事实数据表(简称“事实表”),用来存储数据仓库中的实际数据,如存
储2007年的销售数据的表,即为事实表;另一类是维度数据表(简称“维度表”),如关于时间、促销手段和产品等分析要素的
表均为维度表;在实际的设计中,通常需要根据需求情况重新建立与原始数据不同的表结构。这主要是由于传统业务的数据库是
用来进行事务处理的(即OLTP),而数据仓库则是用来进行分析处理的(即OLAP),用途的不同决定了其结构的不同。
3、数据仓库也是一种数据库,其管理同样是通过数据库管理系统(DBMS)来进行的,因此数据仓库可以像普通的数据库一样进行创
建、修改和删除。当数据仓库的逻辑结构设计完后,就可以创建物理数据仓库了。
4、数据仓库的设计可以说是数据分析和商业智能的最基础的工作。良好的数据仓库结构设计是以后工作能顺利进行的保证。而数据仓
库中的数据则一般要经过“提取--转换--加载”的过程从原始业务数据中获得,这就是ETL过程。
设计和使用ETL
把数据从foodmart.mdb数据库中装载到foodmartsaleDW数据仓库中。需要用到SQL Server Integeration Services 服务,
即SSIS,起操作步骤如下:
(1)打开Bussiness Inteligence Development Studio 选择【文件】-->【新建】-->【项目】命令,弹出“新建项目”对话框,
展开“商业智能项目”,在“模板”窗格中,单击“Integration Service项目”,把项目命名为“foodmartsaleETL”.
(2) 选择【项目】-->【SSIS导入和导出向导】命令,这时会弹出SSIS导入和导出的向导的欢迎界面,单击【下一步】按钮。
(3) 在“选择数据源”窗口中“数据源”下拉列表框中选择Access数据源选项。然后在路径选择中选择此项目文件夹中的
foodmart2000.mdb文件。