最近因为公司要求,有了数据分析的需求。听说airbnb的superset开源十分强大,就勇敢投身研究一下。
顺便记录一下自己的踩坑经历,以后翻翻可以省事儿。
首先安装python >=3.4
安装虚拟环境包
pip install virtualenv
创建虚拟环境
virtualenv superset\env
//激活:
env\Scripts\activate
因为superset下需要特定版本的pandas和sasl,所以建议在虚拟环境下搭建。这也是一个好习惯
第一坑,vs环境:
Superset中依赖的一些库需要使用microsoft visual c++ 2010编译,安装Visual C++ 2015 Build Tools:
https://www.microsoft.com/zh-CN/download/details.aspx?id=48159
第二坑,sasl版本:
https://www.lfd.uci.edu/~gohlke/pythonlibs/#sasl
我是64位,3.6版本的python,所以下载这个cp36
1)前置环境准备完毕后,开始安装superset.
pip install superset
为了加速下载,我们可以切换下载源
使用
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
来更换源
1)创建管理员账号:
fabmanager create-admin --app superset
这里如果
如果出现Was unable to import superset Error: cannot import name '_maybe_box_datetimelike' ......是因为安装的pandas版本问题,将现版本pandas卸载重新安装pandas
pip uninstall pandas
pip install pandas==0.23.4
---------------------
2)Python superset db upgrade
如果报了sql错误,就把sqlalchemy uninstall了切换sqlalchemy==1.2.0
3)加载例子(后续操作都需要在lib\site-packages\superset\bin下)
Python superset load_examples
4) 初始化角色和权限
Python superset init
5)启动服务,端口8088,使用 -p 更改端口号。
Python superset runserver -d