clickhouse+superset搭建数据平台(四)-数据应用(报表可视化设计)

经过前面的步骤,我们已经成功搭建好了数据库,将csv文件中的数据导入到clickhouse中,并将superset和clickhouse成功地连接起来了。现在我们就可以对我们的数据尝试提出一些实际业务问题,使用SQL查询出我们想要的数据结果,并将其可视化为报表形式保存在superset上。

我们不妨从以下几个问题入手:

  1. ⾏⻋⾥程最多的出租⻋Top 100是哪些?
  2. 出租⻋每⽇⾼峰期和低峰期(⼩时级别)是什么时候?
  3. 分析每台出租⻋的平均搭载时⻓是多少?
  4. 分析每日出租车数量趋势?
  5. 分析每日出租车订单趋势?
  6. 分析每日车费(fare)趋势?
  7. 不同距离长度的出租车订单分布如何?

由于SQL比较简单,不做多余解释,看代码就行。重点说明如何将SQL查询保存为数据报表(slice)的过程。

  1. ⾏⻋⾥程最多的出租⻋Top 100是哪些?

在SQL Editor中输入:

SELECT sum(trip_miles ) as trip_miles , taxi_id 
FROM TAXI_TRIPS 
GROUP BY taxi_id 
order by trip_miles DESC 
limit 100

点击Run Query,等待服务器返回结果。点击Save Query保存当前查询。

20200105225127.png

接下来我们将查询结果保存到superset。

点击Explore按钮,页面将跳转到数据切片的详细设置页面,
20200105225524.png

20200105230107.png

①数据源设置

点击数据源设置后,可以看到数据源对应的SQL,因为数据源的名称并不容易记住,我们首先将其修改为更直观的名称,点击Use Legacy DataSource Editor切换回以前的数据源旧编辑器模式(新的我没找到在哪里修改数据源名称),
20200105230500.png
20200105230835.png
修改后保存即可。
回到新版的旧编辑器,在Metrics标签页里,superset为我们自动生成了一个聚合指标count(*),表示记录条数,我们可以自定义生成其他的指标。比如我们可以生成一个出租车里程数的SUM聚合指标,并且将其名称标记为trip_miles。

这里有个坑,要是直接在刚才的可视化界面将Metrics设置为trip_miles,superset会提示一定要将这个量值聚合后才能用于图表构建,而构建后的图表指标名称就变成了SUM(trip_miles),但是我们见到的大多数图表并不会这样标注,通常会直接标注里程数(trip_miles),因此SUM(trip_miles)并不直观,为人们好理解。现在也没有太好的解决方案,只能暂时通过这种创

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值