superset爬过的坑
superset是什么
superset是数据分析与可视化平台。该工具主要特点是可自助分析、自定义仪表盘、分析结果可视化(导出)、用户/角色权限控制,还集成了一个SQL编辑器,可以进行SQL编辑查询等,原来是用于支持Druid的可视化分析,后面发展为支持很多种关系数据库及大数据计算框架,如:mysql, oracle, Postgres, Presto, sqlite, Redshift, Impala, SparkSQL, Greenplum, MSSQL。
安装方式
1.docker安装
2.pip安装
docker安装
pip安装
安装虚拟环境virtualenv
- pip install virtualenv
- virtualenv env (创建虚拟环境 )
- env\Scripts\activate (激活,启用虚拟环境(必须要用反斜杆) )
安装superset(pip install superset)
- 创建管理员帐号,输入管理员信息(fabmanager create-admin --app superset)
- windows下,进入到env\Lib\site-packages\superset\bin下)
- 初始化数据库 ( Python superset db upgrade)
- 加载例子(Python superset load_examples)
- 初始化角色和权限(Python superset init)
- Python superset run
可能遇到的bug
- vs必须使用2015版本
- WIN建议升级到win10
- 前置环境python
- pip建议升级到最新版本
- 报错所需类库常用库查询
数据库(待研究)
superset知识库
后端
- Flask App Builder(鉴权、CRUD、规则)
- Pandas(分析)
- SqlAlchemy(数据库ORM)
前端
- npm、react、webpack
- d3 (数据可视化)
- nvd3.org(可重用图表)
参考文章
- https://www.jianshu.com/p/889f5525ff70
- https://blog.csdn.net/folecld123/article/details/80705616
Superset个人理解
数据可视化:Superset, Redash 和 Metabase
目前看起来Superset在可视化方面做的还是蛮好的,看起来稍微糟糕的2个地方,文档不是很清晰,可视化页面略显粗糙,待研究区域,熟悉现有逻辑的操作,生成可视化图表,如果生成仪盘表,如何接入数据库,前端研究,如果接入echarts基础图表等等。