数据仓库
文章平均质量分 92
zkyCoder
这个作者很懒,什么都没留下…
展开
-
增量表、全量表和拉链表
增量表增量表每次记录的是周期内的新增数据,即每次将周期的新数据增加到原有的数据上。例如,注册用户表,按照天数进行分区,每次将最新一天的注册用户记录按照最新一天的分区加到注册用户表中。以页面访问数据表为例,假设该表从2020-06-01开始记录数据,按天更新,分区为dt。2020-06-01产生了三条访问数据,如下表:2020-06-02首页和商详页又产生了2条访问数据,该两条即为2020-06-02新增的数据,表更新后,dt分区2020-06-02新增2条数据(标红),此时数据表如下:以此类推,转载 2022-05-24 10:21:45 · 4576 阅读 · 0 评论 -
OLAP多维分析
数据立方体(Data Cube)是一种多维模型的表现。当然,这并不是只这个数据只有三维,数据立方体可以被看成是具有多维度的数据。我们以一个例子来理解数据立方体 cube。上图是数据立方体的一个示例。每个方块表示着对应维度的销售额数据。数据立方体是一种多维数据模型,下面介绍一下多维模型的相关概念:• 多维数据模型:为了满足用户从多角度多层次进行数据查询和分析的需要而建立起来的基于事实和维的数据库模型,其基本的应用是为了实现OLAP(Online Analytical Processing)• 立方原创 2021-11-15 22:55:09 · 5466 阅读 · 1 评论 -
数据仓库概述
数据仓库概述数据仓库(Data Warehouse),简称DW或DWH,是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反应历史变化(Time Variant)的数据集合,用于支持管理、运营决策。面对主题的:数据仓库里的数据面向主题作为大分类,例如用户分析主题、流量分析主题等等。这种主题往往也是我们处理数据的目的。集成的:数据仓库的数据不只是通常数据库表里写下的业务数据,也记录下了用户行为相关的埋点数据等,例如用户访问的日志原创 2021-10-20 20:45:47 · 1024 阅读 · 0 评论