Superset航班数据可视化实战

本文详细介绍了如何利用Superset进行航班数据分析,包括数据格式解析、CSV上传、图表创建、Dashboard构建、过滤器应用、高级分析如滚动求均值、时间比较和数据重采样等操作,最后展示了完整的Dashboard示例。
摘要由CSDN通过智能技术生成

1. 航班数据格式

主要字段信息如下:

  • 部门:用Orange、Yellow、Purple代替
  • 票价
  • 舱的类型
  • 单程或往返
  • 航班日期
  • 航班起始地和目的地
  • 航班飞行距离

下载方式:
github下载地址进行下载,用浏览器直接打开文件了,可以使用linux的wget命令进行下载,再上传到本地

2. 开启数据库文件上传功能

打开数据库
打开数据库编辑
添加文件上传功能

3. 上传CSV文件

打开上传文件
表名设置
日期字段设置
此时会在mysql中创建表tutorial_flights, 且superset的table数据集中也会有tutorial_flights数据集

4. 创建图表

打开图表
设置图表
保存图表

5. Dashboard操作

Dashboard操作
点击和拖拽图表的右下角,可以修改图表的大小,最后点击保存

6. Pivot表

创建图表设置图表类型
设置时间
设置聚合字段- 其中ABC表示字符串,#表示数字,时钟符号表示时间

保存图表

7. 折线图(多线)

打开图表设置设置聚合字段

设置图表颜色

设置xy标签
保存图表

8. 给Dashboard添加markdown描述

打开dashboard
编辑dashboard
创建markdown编辑区域鼠标放到</> markdown选项上,然后按住鼠标左键进行拖拽,移动到合适位置,松开鼠标即可

编辑markdown

9. 给dashboard添加过滤器

创建图表
添加图表类型
无时间过滤
设置过滤列
保存图表
过滤前的数据
过滤后的数据- 从上面的两张图可以看出,在Dashboard的过滤器中应用过滤后,Dashbaord的其它图表都会应用此过滤条件

10. 发布Dashboard

可以点击编辑按钮,然后拖拽图表,进行位置的调整,最后保存即可

发布Dashboard

11. 给charts图表和Dashboard添加注释

打开注释层设置注释层名称
添加注释
打开图表
将注释添加到图表
保存图表

保存并转到看板
查看Dashboard- 可以查看charts图表和Dashboard都已经有注释了

12 高级分析

12.1 创建基础图表

新建图表设置图表类型
设置聚合字段
设置图表名称保存图表

12.2 滚动求均值

打开图表设置滚动求平均值

  • 滚动求平均值,本示例滚动周期为7天
  • 10月7号的值为10月1号-10月7号的平均值,10月8号的值为10月2号-10月8号的平均值
  • 因为基础图表的时间范围时10月1号到10月31号,所以10月1号到10月6号没有滚动平均值

保存图表

12.3 时间比较

打开图表
相减后的结果- 例如10月10号的值 = 10月10号的值 - 10月3号的值

当前值和一周前的值

  • 10月10号实线的值:表示10月10号的真实值
  • 10月10号虚线的值:表示10月3号的真实值

保存图表

12.4 数据重采样

选择图表
设置重采样参数

  • 采样周期为7天,取此周期的中位数
  • 每7天有一个数据点
  • 例如10月15号的值 = 10月9号到10月15号,这7天的中位数值
  • 所以图表只有10月1号、10月8号、10月15号、10月22号、10月29号,共5个值

13 最终的Dashboard图片

Dashboard结果

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值