《SQL Server 2005数据挖掘与商业智能完全解决方案》学习笔记(1/12-3/12)

 

商业智能实际上包含两个层次:

第一个层次是在整合系统数据的基础上提供灵活的前端展现。

第二个层次是数据库中的知识发现。知识发现的主要技术构成是数据挖掘。

这种层次关系类比自然界中的普遍规律来理解,比如生态系统中的层次,食物链中的层次,软件架构的层次(MVC)等等。

 

一般,业务数据中的表的关系要基于关系数据库设计的范式,而数据仓库中的表不受关系数据库设计范式的约束。

 

SQL Server创建数据仓库的简单流程:

1 SSIS中进行ETL

2 SSAS中定义数据源,数据源视图,数据立方体(多维数据集),并且将多维数据集部署到Analysis Services数据库中。

3 选择报表服务器项目向导,其中在“选择数据源”窗口中选择部署到第2步中部署到Analysis Services的数据库。

 

数据源:提供与数据库的简单连接

数据源视图:缓存元数据,添加关系,创建计算及设置逻辑等还需要使用数据源视图。在数据源视图中,可以为表设置主键外键使得它们联系起来。一般而言,事实表式没有主键有外键的,而维度表有主键,每一个维度表的主键都是事实表的外键。

 

 

数据的两种组织形式:操作数据和分析数据

 

数据仓库的架构:雪花形,星形,星座形

 

 

数据仓库的设计步骤:

 

 数据仓库的设计步骤

 

关于事实表:

相对维度表而言,事实表应当尽量减小一条记录的长度,这样才能避免事实表过大而难以管理。即,事实表应该是一个细长的结构。事实表中一般包括两部分,一是由主键和外键组成

的键部分,一是用户希望在数据仓库中所了解的数值指标。

 

关于粒度:

数据仓库通常在同一模式中使用多重粒度。可以用低粒度数据保存近期的财务数据和汇总数据,对时间较远的财务数据只保留粒度较大的汇总数据。        

 

维度有五种类型:

结构为,信息维,分区维,分类维和特殊维。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值