windows下Superset开发环境的搭建
优秀的数据分析平台,首先要满足数据查询、统计、多维分析、数据报表等功能。今天教大家如何搭建一套数据分析平台superset。
Superset
Superset是一款轻量级的BI工具,由Airbnb的数据部门开源。整个项目基于Python框架,不是Python我也不会推荐了,它集成了Flask、D3、Pandas、SqlAlchemy等。Superset本身集成了数据查询功能,查询对分析师那是常有的事。它支持各类主流数据库,包括MySQL、PostgresSQL、Oracle、Impala、SparkSQL等,深度支持Druid。后台支持权限分配管理,针对数据源分配账户。所以它在部署服务器后,分析师们可以通过它查询数据,也能通过数据建立Dashboard报表。
安装
1.假设你已经安装好了python和pip。(python的版本建议安装Python 3.4 以上版本,Python 2.7 版本在windows 上存在各种编码问题。)
2.安装 virtualenv。(此步骤可选,直接安装的话跳到第四步。因为Superset需要安装的组件较多,最好是使用virtualenv独立一套python环境。)若将Superset安装到python的安装目录下可能会影响原来python的开发运行环境,所以需要安装虚拟环境virtualenv。
在windows下cmd命令窗口下安装。
安装命令
pip install virtualenv
建立虚拟环境目录,到目录下。这里我的目录(G:\pythonVir)
cd G:\pythonVir
然后激活
virtualenv env
//等待初始化完成..
//激活:
env\Scripts\activate
激活之后的界面如下图,注意在命令行输入的左侧有(env)标记,这样我们的后续操作都会在env中生效,不会影响整体的pyhton环境。
安装VS2015
Superset中依赖的一些库需要使用microsoft visual c++ 2010编译。
根据说明应该是也可以安装 Visual C++ 2015 Build Tools: