Data Warehouse
文章平均质量分 69
wh62592855
这个作者很懒,什么都没留下…
展开
-
维度表和事实表
事实表每个数据仓库都包含一个或者多个事实数据表。事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,事实数据表通常包含大量的行。事实数据表的主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以提供有关单位作为历史的数据,每个事实数据表包含一个由多个部分组成的索引,该索引包含作为外键的相关性维度表的主键,而维度表包含事实记录的特性。事实数据表不应该包含描述性的信息,也不应该包含除转载 2009-11-20 23:34:00 · 2189 阅读 · 0 评论 -
数据仓库
什么是数据仓库? --数据仓库是一个面向主题的,集成的,非易失的且随时间不断变化的数据集合,用来支持管理人员的决策。 下面我就从数据仓库的4个基本特性来说一下它与传统的OLTP(on-line transaction processing联机事务处理)数据库的区别 1.面向主题的 传统的OLTP数据库是面向应用进行数据组织的,而数据仓库则侧重于数据分析工转载 2011-07-01 16:35:00 · 1586 阅读 · 0 评论 -
数据挖掘技术简介
数据挖掘是目前一种新的重要的研究领域。本文介绍了数据挖掘的概念、目的、常用方法、数据挖掘过程、数据挖掘软件的评价方法。对数据挖掘领域面临的问题做了介绍和展望。 关键词:数据挖掘 数据集合 1. 引言 数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。随着信息技术转载 2011-06-10 00:17:00 · 2714 阅读 · 0 评论 -
事实表的设计
事实表中一般要包含2部分:一是由主键和外键所组成的键部分,另一部分是用户希望在数据仓库中所了解的数值指标,这些指标是为每个派生出来的键而定义和计算的,称为事实或指标。由于事实是一种度量,所以事实表中的这种指标往往需要具有数值化和可加性的特征。但是在事实表中,只有那些具有完全可加性的事实才能根据所有的维度进行累加而具有意义。而事实表有一些事实表示的是某种强度,这类事实就不具有完全加法性,而是转载 2011-06-09 22:34:00 · 2925 阅读 · 0 评论 -
Document-oriented database
Document-oriented database转载 2010-08-15 13:19:00 · 1322 阅读 · 0 评论 -
星型模型 和 雪花模型
星型模型 和 雪花模型转载 2010-06-02 22:46:00 · 5226 阅读 · 0 评论 -
什么是退化维(Degenerate Dimensions)
什么是退化维(Degenerate Dimensions)转载 2010-06-02 17:20:00 · 6165 阅读 · 0 评论 -
什么是ODS
Normal 0 7.8 磅 0 2 false false false MicrosoftInternetExplorer4 <!-- /*转载 2010-05-22 19:46:00 · 2420 阅读 · 1 评论 -
Correlation database
A Correlation database is a database management system (DBMS) that is data model independent and designed to efficiently handle unplanned, ad hoc queries in an analytical system environment. It was de转载 2010-04-30 14:00:00 · 1093 阅读 · 1 评论 -
Column-oriented DBMS
A column-oriented DBMS is a database management system (DBMS) which naturally stores its content by column rather than by row. This has advantages for databases such as <a title="Data warehouse" hre转载 2010-04-30 13:59:00 · 2025 阅读 · 0 评论 -
ETL--能给客户带来什么
ETL数据转换系统能给客户带来什么社会的需求和计算机技术的不断发展,人们开始对原来数据库中的数据进行再加工,形成一个综合的、面向分析的环境,以支持科学决策的产生。由此,数据仓库的思想、技术、产品逐渐开始形成。构建数据仓库的目的是要建立一种体系化的数据存贮环境,将分析决策所需的大量数据从传统的操作环境中分离出来,使分散的、不一致的操作数据转换成集成的、统一的信息,组织内不同单位都可以在单一的环境下,转载 2010-01-11 23:57:00 · 1094 阅读 · 0 评论 -
ETL简介
ETL,Extraction-Transformation-Loading的缩写,中文名称为数据抽取、转换和加载。ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。ETL是数据仓库中的非常重要的一环。它是承前启后的必要的一步。相对于关系数据库,数据仓库技术没有严格的数学理转载 2010-01-11 23:55:00 · 1127 阅读 · 0 评论 -
OLTP和OLAP的区别
OLAP(联机分析处理)什么是联机分析处理(OLAP)联机分析处理 (OLAP) 的概念最早是由关系数据库之父E.F.Codd于1993年提出的,他同时提出了关于OLAP的12条准则。OLAP的提出引起了很大的反响,OLAP作为一类产品同联机事务处理 (OLTP) 明显区分开来。当今的数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction proces转载 2009-11-20 23:35:00 · 9537 阅读 · 1 评论 -
缓慢变化维的处理
维度建模的数据仓库中,有一个概念叫Slowly Changing Dimensions ,中文一般翻译成“缓慢变化维”,经常被简写为SCD 。缓慢变化维的提出是因为在现实世界中,维度的属性并不是静态的,它会随着时间的流失发生缓慢的变 化。这种随时间发生变化的维度我们一般称之为缓慢变化维,并且把处理维度表的历史变化信息的问题称为处理缓慢变化维的问题,有时也简称为处理SCD 的问题。 处理缓慢变化维的转载 2010-04-26 16:18:00 · 1788 阅读 · 0 评论