【大数据】基础

事实表和维度表

维度表

代表描述一个东西的,比如商品,用户

  • 不大
  • 很宽
  • 变动小
事实表

代表一个业务事件,比如一个下单:

  • 很大
  • 列数一般比较少
  • 经常变化,每天会增加

实时计算和实时数仓

实时计算

追求时效性,直接得结果,计算中间结果没有保存,这些中间结果需要重新计算

实时数仓

对数据处理流程进行规划,分层,提高复用性,B和C都用到A了
请添加图片描述

OLAP分类

  • MOLAP 主要是druid和kylin,通过空间和预计算换在线查询时间
  • ROLAP Presto Impala GP CK 在原始数据上执行sum,group by操作,比较灵活,消耗资源
  • HOLAP MOLAP和ROLAP的融合体,对于聚合的,使用MOLAP预计算数据模型,其他的使用ROLAP,比如鼎石的DorisDB

星型模型和雪花模型

星形模型

在这里插入图片描述
多维数据集的每一个维度都直接与事实表相连接,数据有冗余

雪花模型

在这里插入图片描述
数据冗余少,但是效率一看就低

基础架构

  • SMP 所有资源都共享(shared everything)
  • NUMA 拿出一部分资源共享
  • shared nothing 几乎不分享(除了网络带宽啥的)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值