Data Warehouse
kingzone_2008
对于机器学习数据挖掘相关技术有浓厚兴趣
展开
-
数据仓库(六):数据仓库的概念设计
在数据集市设计中可以使用3种基本的系统方法:数据驱动的方法、需求驱动的方法和混合方法。它们的区别在于源数据库分析和终端用户需求分析阶段所占的比重。方法的选择将极大地影响概念设计的方式。数据驱动方法包括:基于实体-关系模式的设计、基于关系模式的设计、基于XML模式的设计。概念型实体-关系模式比关系型逻辑模式更具表达力。因此通常认为前者是更好的设计源。但实际情况是公司经常无法提供精确完整的实体-关原创 2013-05-12 15:40:54 · 3339 阅读 · 0 评论 -
数据仓库(九):维度设计与OWB实战:建立维表与事实表
1 维度表在星型模式中,每个维度表都分配有一个代理键(surrogate key,SK)。该列是维度表的唯一标识符,是维度表的事实主键(这里事实主键是指事实意义上的主键,能唯一标识维度表中的一行),只在数据仓库中创建。代理键在星型模式的加载过程中分配和维护。代理键没有内在的含义,通常表现为一个整数。代理键有时指的是warehouse key,是维度表的主键。维度表中也包含类似操作型系统中存原创 2013-05-31 17:36:22 · 13136 阅读 · 4 评论 -
数据仓库(八):数据仓库中数据库设计的基本模型对比--Inmon
注:本文参考Inmon的著作,Inmon支持关系模型,因此下面的观点基本都是支持关系模型的。关于多维模型的内容可参考Kimball的著作《数据仓库工具箱:维度建模的完全指南》等。广泛采用的数据库设计模型有两种:关系型和多维型。在数据仓库的设计方法中关系模型是“Inmon”方法,多维模型是“Kimball”方法。在建立数据仓库过程中,对于数据库设计而言,建立关系型数据库是最佳的长期的方法;多维模原创 2013-05-20 15:42:36 · 8936 阅读 · 0 评论 -
数据仓库(十):OLAP技术
1 几种OLAPOLAP服务器通常采用多维模型(Inmon认为多维模型应当用在数据集市上,而数据仓库应采用关系模型;Kimball认为可以直接采用多维模型建立维度数据仓库。二人均认可多维模型,只是应用场景不同),其具体实现可分为:ROLAP(关系型联机分析处理):ROLAP基本数据和聚合数据均存放在RDBMS之中。MOLAP(多维联机分析处理):MOLAP基本数据和聚合数据均存放于多维原创 2013-06-03 13:06:26 · 4189 阅读 · 0 评论 -
数据仓库(七):Oracle Warehouse Builder(OWB)创建数据仓库
本文简述使用OWB创建数据仓库的一般过程。Oracle的OWB是目前最好的三大ETL产品之一。OWB不但可以可以完成数据的抽取、转换和加载,还能帮助用户在Oracle数据库中创建ROLAP(Relational Online Analysis Process)和MOLAP(Multidimensional Online Analysis Process)数据仓库对象,数据质量管理,商务智能定义等。原创 2013-05-14 10:01:37 · 21699 阅读 · 6 评论 -
数据仓库(五):数据仓库的概念建模与概念设计-Golfarelli
数据仓库设计包括3个主要阶段:概念设计、逻辑设计、物理设计。3种不同的设计场景:数据驱动的场景、需求驱动的场景、混合场景。在数据集市设计中可以使用3种基本的系统方法:数据驱动的方法、需求驱动的方法和混合方法。它们的区别在于源数据库分析和终端用户需求分析阶段所占的比重。1. 概念建模目前普遍认可数据集市基于数据的多维视图(即采用多维模型,常用的模式包括星型模型、雪花模型),但是对于如何根据用原创 2013-05-10 23:06:46 · 6005 阅读 · 0 评论 -
数据挖掘系列之四(数据仓库之二):数据仓库设计--Kimball方法
(注意:本文介绍的是数据仓库设计的Kimball方法,即多维模型;关系模型,即Inmon方法参见(四))1. OLAP(联机分析处理)与OLTP(联机事务处理)主要区别用户和系统的面向性:OLTP面向事务,日常操作;OLAP面向分析,用于决策支持。数据内容:OLTP当前数据;OLAP历史数据数据库设计:OLTP使用ER图、面向应用;OLAP使用星形模式或雪花,面向主题。视图:O原创 2012-12-07 14:25:09 · 6797 阅读 · 0 评论 -
数据仓库(四):设计数据仓库--Inmon方法
(注意:本文参考的是Inmon的著作,因此主要介绍数据仓库设计的Inmon方法,即关系模型;关于维度模型,即Kimball方法可以参考本系列(二)(五)(六)等)建数据仓库主要包括两部分工作:与操作型系统接口的设计和数据仓库本身的设计。此处用“设计”一词并不准确,在数据仓库之三中我们提到数据仓库是在启发方式下建造的,即螺旋式的开发过程:首先载入一部分数据供DSS分析员使用,然后根据反馈修改数据原创 2013-05-04 00:30:43 · 10867 阅读 · 0 评论 -
数据挖掘系列之一(数据仓库之一):数据仓库概述
数据仓库是一个从多个数据源收集的信息储存库,存放在一个一致的模式下,并且通常驻留在单个站点。数据仓库通过数据清理、数据变换、数据集成、数据装入和定期数据刷新过程来构造。数据仓库收集了整个组织的主题信息,因此它是企业范围的。数据集市(data mart)是数据仓库的一个部门子集,它聚焦在选定的主题上,是部门范围的。数据仓库非常适合联机分析处理(OLAP)。OLAP操作包括下钻(drill-d原创 2012-11-02 20:15:11 · 6802 阅读 · 0 评论