数据产品/分析师经常接触的一个分支就是多维数据分析工具或者叫BI工具,以前也使用一些,开一个系列分享。常见的tableau、superset、网易有数等,记录实际使用感受。
介绍一下superset是什么
”Superset 是 Airbnb 开源的大数据可视化平台“ 这个是比较官方的介绍。 我实际给这个产品的评价,这是一个 轻量化开箱即用的多维分析BI工具,通过连接数据库进行拖拽点选的方式解决一些数据图表可视化,业务Dashboard的需求。轻量化 是说superset 在处理数据量级上有很一些局限性,据我实际使用体验来看,1000W以内比较OK,再多就比较慢了。多说一句,其实也是可以和kylin配合使用的 kylin作为计算引擎,提前计算好然后superset展示起数据起来就好多了。
开箱即用,实际上运维部署的时候也比较简单,装好了以后使用不用前端进行图表开发,分析师拖拽/sql写出来是什么样分享出去其他人用起来就是什么样。
业务报表 Dashboard 这方面支持还比较丰富,截图上可以看到挺丰富的
开源免费
解决什么问题
中小团队在没有独立团队自己开发BI工具的情况下,能借助拖拽式的BI工具快速进行数据分析,搭建数据看板。并且进行一定程度上的二次开发,以最小成本,最快速度 满足基础数据使用的需求。安装
建议使用Docker安装,只需要按照下面这篇文章里面 复制-粘贴-执行就可以了。特别是对于只是想体验一些这个工具的操作、颜值 图表如何的朋友来说,实在是不需要去折腾什么python、pip安装。 基于docker安装superset http://markey.cc/2018/02/10/%E5%9F%BA%E4%BA%8Edocker%E5%AE%89%E8%A3%85superset/ 提供一个不用安装可以直接体验的地址地址:http://sykaibi.cn:8088/login/#
账号:superset1
密码:superset123
使用
核心操作很简单,连接数据
创建charts
创建看板Dashbord
分享查看
优势汇总
比较优秀的BI开源解决方案,Apache Superset 这个名字就可以看出 已经贡献给Apache 基金会,质量有保证。
开源免费
支持的图表类型丰富
易于安装
操作容易上手,如果熟悉Excel透视表或者类似的BI工具几乎没有什么操作的难度 一两个小时就可以上手出一些简单的图表
劣势汇总
Superset不能直接使用联合查询,只能从单个表查找数据。但是它提供的视图的概念,可以编写视图SQL,最终在视图上执行单表查询操作
对大数据量(1000W行以上)的处理比较慢
权限管理有限,对团队规模比较大的团队不太适用,比较适合几十个人 到几百人的中小团队,公司规模大一些的可以在这个基础上做二次开发。