数据仓库/BI
文章平均质量分 86
大数据最好
大数据,机器学习,深度学习
展开
-
数据集市
数据集市(Data Market)是一种更小、更集中的数据仓库。简单地说,原始数据从数据仓库流入不同的部门以支持这些部门的定制化使用。这些部门级的数据库就称为数据集市。一个数据集市就是一个部门的数据集合。数据集市是为特定部门的决策支持而组织起来的一批数据和业务规则,习惯上称它们为“主题域”。不同部门有不同的“主题域”,因而也就有不同的数据集市。例如,财务部门有自己的数据集市,市场部门也有自己的数据原创 2015-04-26 19:15:56 · 1744 阅读 · 0 评论 -
ETL介绍与ETL工具比较
ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过萃取(extract)、转置(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分原创 2015-02-03 23:46:52 · 36202 阅读 · 4 评论 -
什么是BI
下面将从七个方面介绍BI一、BI的定义BI是Business Intelligence的英文缩写,中文解释为商务智能,用来帮助企业更好地利用数据提高决策质量的技术集合,是从大量的数据中钻取信息与知识的过程。简单讲就是业务、数据、数据价值应用的过程。用图解的方式可以理解为下图:图(1)这样不难看出,传统的交易系统完成的是Business到Data的过程,而BI要做的事情是在D原创 2015-02-04 00:04:11 · 936 阅读 · 0 评论 -
informatica体系结构
Powercenter体系结构和主要组件介绍服务端组件Informatica Service:PowerCenter服务引擎Integration Service:数据抽取、转换、装载服务引擎Repository Service:知识库Service,管理ETL过程中产生的元数据Repository 的数据存储在第原创 2015-04-30 21:13:07 · 1415 阅读 · 0 评论 -
维度建模步骤
数据模型是指用实体、属性、实体之间的关系对业务概念和逻辑规则进行统一的定义,命名和编码,主要描述企业的信息需求和业务规则,是业务人员和开发人员沟通的语言,是数据仓库架构设计工作开始的第一步。正确的数据模型是用户需求的集中体现,是商业智能项目成功与否最重要的因素之一。数据模型可以分为概念模型、逻辑模型、物理模型,本节进行详细的介绍。 3.6.1 概念模型 从定义上来说,原创 2015-05-15 10:50:00 · 7297 阅读 · 0 评论 -
事实表 和 维度表
维度表示你要对数据进行分析时所用的一个量, 比如你要分析产品销售情况, 你可以选择按类别来进行分析,或按区域来分析. 这样的按..分析就构成一个维度。前面的示例就可以有两个维度:类型和区域。另外每个维度还可以有子维度(称为属性),例如类别可以有子类型,产品名等属性。下面是两个常见的维度表结构:产品维度表:Prod_id, Product_Name, Category, Color,原创 2015-04-27 19:25:31 · 2702 阅读 · 0 评论 -
数据仓库面试题资料
什么叫数据仓库? 数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,它用于支持企业或组织的决策分析处理。数据仓库是为了便于多维分析和多角度展现而将数据按特定的模式进行存储所建立起来的关系型数据库,它的数据基于OLTP源系统。 首先,用于支持决策,面向原创 2015-05-02 14:59:00 · 25252 阅读 · 1 评论 -
数据仓库中的维度
维度维度在数据仓库中主要对事实指标进行过滤和重新组织提供指导。可以将用户对事实的查询结果按照维度指标进行筛选,只允许与维度指标相关的数据返回给用户。维度一般具有如下特性:可以形成一个维度体系,具备访问和过滤事实的能力,能够提供相关的非标准实体,包括一个完整的维度体系编码、关键词以及相关的表示,可以映射到用户所需要信息的列。在物理数据仓库中是较小的表,可以对前台用户的应用程序进行数据填充,或原创 2015-04-26 21:59:38 · 4102 阅读 · 1 评论 -
数据仓库粒度
概述粒度问题是设计数据仓库的一个最重要方面。粒度是指数据仓库的数据单位中保存数据的细化或综合程度的级别。细化程度越高,粒度级就越小;相反,细化程度越低,粒度级就越大。数据的粒度一直是一个设计问题。数据仓库环境中粒度之所以是主要的设计问题,是因为它深深地影响存放在数据仓库中的数据量的大小,同时影响数据仓库所能回答的查询类型。粒度的大小需要数据仓库在设计时在数据量大小与查询的详细程度之间作原创 2015-04-26 19:41:45 · 1408 阅读 · 0 评论 -
数据建模
数据模型数据模型是指用实体、实体的属性、实体之间的关系对企业在运营活动中涉及到所有业务概念和业务活动进行统一的定义和描述。数据模型是业务人员和技术开发人员之间沟通的平台。这里先解释下两个概念实体:现实世界中存在的可以相互区分的事务或概念念称为实体。实体可以分为事物实体和概念实体。例如:一个学生、一个工人等是事物实体。一门课、一个班级等称为概念实体。实体的属性:每个实体都有自己的原创 2015-04-26 21:58:09 · 911 阅读 · 0 评论 -
数据仓库定义及特点
数据仓库之父Bill Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Ma原创 2015-04-26 18:26:27 · 11619 阅读 · 0 评论 -
数据仓库创建步骤
建设数据仓库 建立数据仓库是一个解决企业问题的过程,业务人员往往不懂如何建立和使用数据仓库,发挥其决策支持的作用;信息部门的人员往往又不懂业务,不知道应该建立哪些决策主题,从数据源中抽取哪些数据。因此数据仓库的项目小组应该由业务人员和信息部门的人员共同组成,双方需要相互沟通,协作开发数据仓库。 开发数据仓库的过程包括以下几个步骤。 1.系统分析,确定主题 建原创 2015-04-26 18:59:21 · 6956 阅读 · 1 评论 -
OLTP和OLAP
Oracle OLAP 与 OLTP 介绍数据处理大致可以分成两大类: 联机事务处理 OLTP(on-line transactionprocessing)、联机分析处理 OLAP(On-Line Analytical Processing)。(1)OLTP 是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。OLTP 系统强调数据库内存效率,强调内存各种指原创 2015-02-03 17:06:21 · 453 阅读 · 0 评论