目录
1. 航班数据格式
主要字段信息如下:
- 部门:用Orange、Yellow、Purple代替
- 票价
- 舱的类型
- 单程或往返
- 航班日期
- 航班起始地和目的地
- 航班飞行距离
下载方式:
从github下载地址进行下载,用浏览器直接打开文件了,可以使用linux的wget命令进行下载,再上传到本地
2. 开启数据库文件上传功能



3. 上传CSV文件



此时会在mysql中创建表tutorial_flights, 且superset的table数据集中也会有tutorial_flights数据集
4. 创建图表



5. Dashboard操作

点击和拖拽图表的右下角,可以修改图表的大小,最后点击保存
6. Pivot表



- 其中ABC表示字符串,#表示数字,时钟符号表示时间

7. 折线图(多线)





8. 给Dashboard添加markdown描述


鼠标放到</> markdown选项上,然后按住鼠标左键进行拖拽,移动到合适位置,松开鼠标即可

9. 给dashboard添加过滤器






- 从上面的两张图可以看出,在Dashboard的过滤器中应用过滤后,Dashbaord的其它图表都会应用此过滤条件
10. 发布Dashboard
可以点击编辑按钮,然后拖拽图表,进行位置的调整,最后保存即可

11. 给charts图表和Dashboard添加注释







- 可以查看charts图表和Dashboard都已经有注释了
12 高级分析
12.1 创建基础图表





12.2 滚动求均值


- 滚动求平均值,本示例滚动周期为7天
- 10月7号的值为10月1号-10月7号的平均值,10月8号的值为10月2号-10月8号的平均值
- 因为基础图表的时间范围时10月1号到10月31号,所以10月1号到10月6号没有滚动平均值

12.3 时间比较

- 例如10月10号的值 = 10月10号的值 - 10月3号的值

- 10月10号实线的值:表示10月10号的真实值
- 10月10号虚线的值:表示10月3号的真实值

12.4 数据重采样


- 采样周期为7天,取此周期的中位数
- 每7天有一个数据点
- 例如10月15号的值 = 10月9号到10月15号,这7天的中位数值
- 所以图表只有10月1号、10月8号、10月15号、10月22号、10月29号,共5个值
13 最终的Dashboard图片

本文详细介绍了如何利用Superset进行航班数据分析,包括数据格式解析、CSV上传、图表创建、Dashboard构建、过滤器应用、高级分析如滚动求均值、时间比较和数据重采样等操作,最后展示了完整的Dashboard示例。
820

被折叠的 条评论
为什么被折叠?



