![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据仓库
文章平均质量分 89
sheep8521
让优秀成为一种习惯
展开
-
数据仓库的创建和选型(详细篇)
简介目前业界较为主流的是数据仓库厂商主要是 IBM 和 NCR,这两家公司的除了能够提供较为强大的数据仓库平台之外,也有各自的针对某个行业的数据模型。例如,在银行业,IBM 有自己的 BDWM(Banking data warehouse model),而 NCR 有自己的 FS-LDM 模型。在电信业,IBM 有 TDWM(Telecom Data warehouse model),而 NCR...原创 2019-01-10 18:21:37 · 3774 阅读 · 0 评论 -
数据指标体系的构建思路
前言指标一般分为:结果性指标和过程性指标1)结果性指标,比如电商场景下的 GMV 或订单量,它通常是业务漏斗的底部,是一个不可更改的、后验性的指标。2)过程性指标,可以简单理解为我到达这个结果之前经过的路径,以及通过这个路径去衡量转化好坏的过程,它是可干预的,而且通常是“用户行为”。在实际的业务运营过程中,不仅要关注结果性指标,更要关注过程性指标,通过优化过程性指标便能够更加有效的达成结果性指标。在了解了指标的类型之后我们就可以着手开始搭建我们的指标体系了,首先需要找到什么是我们关注的核心指标?原创 2021-06-28 17:14:16 · 1679 阅读 · 0 评论 -
数据仓库应用篇(一)需求文档模板和需求评审
一、需求文档模板1、产品需求文档:文档标识、产品概述、功能说明、全局说明、非功能性需求等2、交互设计文档(DRD):3、报表需求文档:1)业务数据:业务场景、指标名称、指标定义、维度、维度定义/枚举值、用表及操作口径定义2)数据结果展示:字段、字段类型、枚举值、筛选器、数据展示路径、报表名称维度组合:其他信息:数据输出方式(接口、报表、其他),数据输出日期(实时、日、周、月),如果是按日的话注明t+n3)填写说明:业务场景:可以描述程xxx功能的使用情况,xxx改版效果评估,即实际原创 2020-09-28 13:57:36 · 1766 阅读 · 0 评论 -
数据仓库(一):数据仓库的两种建模方法
数据仓库的两种建模方法 范式建模 Inmon提出的集线器的自上而下(EDW-DM)的数据仓库架构。操作型或事务型系统的数据源,通过ETL抽取转换和加载到数据仓库的ODS层,然后通过ODS的数据建设原子数据的数据仓库EDW,EDW不是多维格式的,不方便上层应用做数据...原创 2018-09-14 15:18:51 · 5518 阅读 · 0 评论 -
数据仓库(二):数据仓库为什么要分层
数据仓库为什么要分层 如何分层结合Inmon和Kimball的集线器式和总线式的数据仓库的优点,分层为ODS【-MID】-DW-DM-OLAP/OLAM/appODS层是将OLTP数据通过ETL同步到数据仓库来作为数据仓库最基础的数据来源。在这个过程中,数据经...原创 2018-09-14 15:21:35 · 1687 阅读 · 1 评论 -
数据仓库(三)功能流程介绍
数据仓库技术 https://blog.csdn.net/zzq900503/article/details/78405958#commentBox从功能结构划分,数据仓库系统至少应该包含数据获取(Data Acquisition)、数据存储(Data Storage)、数据访问(Data Access)三个关键部分。一、数据获取实现ETL转换的过程体现为以下几个方面:1、空值处理:可捕获...原创 2019-09-04 17:54:28 · 1367 阅读 · 0 评论 -
数据仓库的第一/二/三范式(课外篇)
一、数据库设计范式及其意义和不足数据库的设计范式是数据库设计所需要满足的规范,数据库的规范化是优化表的结构和优化把数据组织到表中的方式,这样使数据更明确,更简洁。实践中,通常把一个数据库分成两个或多个表并定义表之间的关系以做到数据隔离,添加、删除和修改某个字段只需要在一个表中进行,接着可以通过定义的关系传递到数据库中剩余的表中(和分层思想的意义所在很相似)。这样我们可以消除很多错误或垃圾数据出现...原创 2019-01-10 15:16:10 · 1392 阅读 · 0 评论 -
数据仓库实战(一)拉链表和流水表
前言本文将会谈一谈在数据仓库中拉链表相关的内容,包括它的原理、设计、以及在我们大数据场景下的实现方式。全文由下面几个部分组成: 先分享一下拉链表的用途、什么是拉链表。 通过一些小的使用场景来对拉链表做近一步的阐释,以及拉链表和常用的切片表的区别。 举一个具体的应用场景,来设计并实现一份拉链表,最后并通过一些例子说明如何使用我们设计的这张表(因为现在Hive的大规模使用,我们会以Hive场...原创 2019-04-10 16:52:21 · 13094 阅读 · 1 评论