美团大数据查询技术

本文介绍了美团大数据查询技术,主要探讨了Presto的系统架构及其在即席查询中的应用,同时阐述了分布式OLAP系统扩展技术,包括Kylin的预聚合、Druid的流式写入隔离、Clickhouse的SIMD加速以及Doris的融合计划。文章还分享了数据库对比方法和实际改造案例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

系列文章

  1. 实时存储引擎和实时计算引擎
  2. 美团点评 Hadoop/Spark 系统实践
  3. 美团大数据查询技术
  4. 美团深度学习平台实践
  5. 美团广告系统实践


本文主要涉及数据资源与服务中的数据产品数据服务部分。
在这里插入图片描述
本文目录如下:
在这里插入图片描述

一、应用场景

背景:电子公交卡的业务试点,想要了解这个业务对整个美团 App 有什么样的影响。
在这里插入图片描述
《增长黑客》中提到了一个海盗模型的方法,本质上是对流量的转换做一个漏斗形的拆解和分析。包含了从获取用户到用户转化和激活的步骤和对应的分析方法。
在这里插入图片描述
但是仅有方法是不够的,还要有对应的数据支撑。那数据是怎么组织的呢?这里分为5个部分。
在这里插入图片描述在这里插入图片描述
那我们要做这些分析的时候该怎么办呢?

就要看下面这种 SQL。
先看 FROM,关联订单表、城市表和城市维度表
然后看 WHERE,选出来在 18 年 8 月到 19 年 8 月之间的公交业务和复购的订单
再看 GROUP BY 和 SUM,基本就清楚了。
在这里插入图片描述
这里用到了之前说到的 OLAP 分析。OLAP 分析有哪些方法呢?这里提到了 5 种。

  1. 钻取(下钻):增加维度,能够通过更细的粒度去分析问题。(假设一个长方体有一层,扩展成三层)
  2. 上卷(上钻):减少维度,能够从宏观(相对)的角度看待问题。(假设一个立方体有三层,压缩成一层)
  3. 切片:同一个维度,只看其某一个值。(假设一个立方体有三层,只保留一层)
  4. 切块:同一个维度,只看其某几个值。(假设一个立方体有三层,只保留两层)
  5. 旋转:行列变换。
    在这里插入图片描述
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值