进阶-第32__深入聚合数据分析_bucket与metric两个核心概念的讲解

课程大纲

 

1、文本编辑器介绍

 

(1)windows操作系统,原生的txt文本编辑器,一些json格式,不太方便去调整

(2)notepad++,功能不是太丰富

(3)sublime,整个功能也比较丰富,比较好,自己可以上网去下载,官网,免费的

 

2、两个核心概念:bucket和metric

 

bucket:一个数据分组

 

city name

 

北京 小李

北京 小王

上海 小张

上海 小丽

上海 小陈

 

基于city划分buckets

 

划分出来两个bucket,一个是北京bucket,一个是上海bucket

 

北京bucket:包含了2个人,小李,小王

上海bucket:包含了3个人,小张,小丽,小陈

 

按照某个字段进行bucket划分,那个字段的值相同的那些数据,就会被划分到一个bucket中

 

有一些mysql的sql知识的话,聚合,首先第一步就是分组,对每个组内的数据进行聚合分析,分组,就是我们的bucket

 

metric:对一个数据分组执行的统计

 

当我们有了一堆bucket之后,就可以对每个bucket中的数据进行聚合分词了,比如说计算一个bucket内所有数据的数量,或者计算一个bucket内所有数据的平均值,最大值,最小值

 

metric,就是对一个bucket执行的某种聚合分析的操作,比如说求平均值,求最大值,求最小值

 

select count(*)

from access_log

group by user_id

 

bucket:group by user_id --> 那些user_id相同的数据,就会被划分到一个bucket中

metric:count(*),对每个user_id bucket中所有的数据,计算一个数量

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值