目录
1. 航班数据格式
主要字段信息如下:
- 部门:用Orange、Yellow、Purple代替
- 票价
- 舱的类型
- 单程或往返
- 航班日期
- 航班起始地和目的地
- 航班飞行距离
下载方式:
从github下载地址进行下载,用浏览器直接打开文件了,可以使用linux的wget命令进行下载,再上传到本地
2. 开启数据库文件上传功能
3. 上传CSV文件
此时会在mysql中创建表tutorial_flights, 且superset的table数据集中也会有tutorial_flights数据集
4. 创建图表
5. Dashboard操作
点击和拖拽图表的右下角,可以修改图表的大小,最后点击保存
6. Pivot表
- 其中ABC表示字符串,#表示数字,时钟符号表示时间
7. 折线图(多线)
8. 给Dashboard添加markdown描述
鼠标放到</> markdown选项上,然后按住鼠标左键进行拖拽,移动到合适位置,松开鼠标即可
9. 给dashboard添加过滤器
- 从上面的两张图可以看出,在Dashboard的过滤器中应用过滤后,Dashbaord的其它图表都会应用此过滤条件
10. 发布Dashboard
可以点击编辑按钮,然后拖拽图表,进行位置的调整,最后保存即可
11. 给charts图表和Dashboard添加注释
- 可以查看charts图表和Dashboard都已经有注释了
12 高级分析
12.1 创建基础图表
12.2 滚动求均值
- 滚动求平均值,本示例滚动周期为7天
- 10月7号的值为10月1号-10月7号的平均值,10月8号的值为10月2号-10月8号的平均值
- 因为基础图表的时间范围时10月1号到10月31号,所以10月1号到10月6号没有滚动平均值
12.3 时间比较
- 例如10月10号的值 = 10月10号的值 - 10月3号的值
- 10月10号实线的值:表示10月10号的真实值
- 10月10号虚线的值:表示10月3号的真实值
12.4 数据重采样
- 采样周期为7天,取此周期的中位数
- 每7天有一个数据点
- 例如10月15号的值 = 10月9号到10月15号,这7天的中位数值
- 所以图表只有10月1号、10月8号、10月15号、10月22号、10月29号,共5个值