商业智能实际上包含两个层次:
第一个层次是在整合系统数据的基础上提供灵活的前端展现。
第二个层次是数据库中的知识发现。知识发现的主要技术构成是数据挖掘。
这种层次关系类比自然界中的普遍规律来理解,比如生态系统中的层次,食物链中的层次,软件架构的层次(MVC)等等。
一般,业务数据中的表的关系要基于关系数据库设计的范式,而数据仓库中的表不受关系数据库设计范式的约束。
在SQL Server创建数据仓库的简单流程:
1 在SSIS中进行ETL操
2 SSAS中定义数据源,数据源视图,数据立方体(多维数据集),并且将多维数据集部署到Analysis Services数据库中。
3 选择报表服务器项目向导,其中在“选择数据源”窗口中选择部署到第2步中部署到Analysis Services的数据库。
数据源:提供与数据库的简单连接
数据源视图:缓存元数据,添加关系,创建计算及设置逻辑等还需要使用数据源视图。在数据源视图中,可以为表设置主键外键使得它们联系起来。一般而言,事实表式没有主键有外键的,而维度表有主键,每一个维度表的主键都是事实表的外键。
数据的两种组织形式:操作数据和分析数据
数据仓库的架构:雪花形,星形,星座形
数据仓库的设计步骤:
关于事实表:
相对维度表而言,事实表应当尽量减小一条记录的长度,这样才能避免事实表过大而难以管理。即,事实表应该是一个细长的结构。事实表中一般包括两部分,一是由主键和外键组成
的键部分,一是用户希望在数据仓库中所了解的数值指标。
关于粒度:
数据仓库通常在同一模式中使用多重粒度。可以用低粒度数据保存近期的财务数据和汇总数据,对时间较远的财务数据只保留粒度较大的汇总数据。
维度有五种类型:
结构为,信息维,分区维,分类维和特殊维。