《SQL Server 2005数据挖掘与商业智能完全解决方案》学习笔记(1/12-3/12)

最新推荐文章于 2020-10-09 19:25:33 发布

feliciafay

最新推荐文章于 2020-10-09 19:25:33 发布

阅读量1.4k

点赞数

分类专栏： DataMining_MachineLearning 文章标签： sql server 数据挖掘商业智能数据仓库数据库 ssis

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/feliciafay/article/details/5561572

版权

DataMining_MachineLearning 专栏收录该内容

19 篇文章 0 订阅

订阅专栏

商业智能实际上包含两个层次：

第一个层次是在整合系统数据的基础上提供灵活的前端展现。

第二个层次是数据库中的知识发现。知识发现的主要技术构成是数据挖掘。

这种层次关系类比自然界中的普遍规律来理解，比如生态系统中的层次，食物链中的层次，软件架构的层次(MVC)等等。

一般，业务数据中的表的关系要基于关系数据库设计的范式，而数据仓库中的表不受关系数据库设计范式的约束。

在SQL Server创建数据仓库的简单流程：

1 在SSIS中进行ETL操

2 SSAS中定义数据源，数据源视图，数据立方体(多维数据集)，并且将多维数据集部署到Analysis Services数据库中。

3 选择报表服务器项目向导，其中在“选择数据源”窗口中选择部署到第2步中部署到Analysis Services的数据库。

数据源：提供与数据库的简单连接

数据源视图：缓存元数据，添加关系，创建计算及设置逻辑等还需要使用数据源视图。在数据源视图中，可以为表设置主键外键使得它们联系起来。一般而言，事实表式没有主键有外键的，而维度表有主键，每一个维度表的主键都是事实表的外键。

数据的两种组织形式：操作数据和分析数据

数据仓库的架构：雪花形，星形，星座形

数据仓库的设计步骤：

数据仓库的设计步骤

关于事实表：

相对维度表而言，事实表应当尽量减小一条记录的长度，这样才能避免事实表过大而难以管理。即，事实表应该是一个细长的结构。事实表中一般包括两部分，一是由主键和外键组成

的键部分，一是用户希望在数据仓库中所了解的数值指标。

关于粒度：

数据仓库通常在同一模式中使用多重粒度。可以用低粒度数据保存近期的财务数据和汇总数据，对时间较远的财务数据只保留粒度较大的汇总数据。

维度有五种类型：

结构为，信息维，分区维，分类维和特殊维。

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。