(一)介绍
什么是Apache Superset?
Apache Superset是一个现代的、可供企业使用的商业智能(BI)网络应用。它具有快速、轻量、直观和选择性加载的特性。正因为这些特性,不管是简单的饼图还是非常复杂的deck.gl空间图表,不同技术的开发者都能容易地探索和可视化他们的数据。
上手Superset的方法:
- 从Apache基金会网页下载源码
- 从Pypi下载最新版本的Superset
- 使用Docker Compose通过一条命令在本地设置Superset(译者注:后续会有更新)
- 从Dockhub下载Docker镜像
- 从Github安装最新版本的Superset
Superset提供:
- 适用于可视化数据集和精巧制作交互式仪表盘的直观界面
- 大量漂亮的可视化效果(用于展示数据)
- 用于提取和展示数据的无需编写代码的可视化效果生成器
- 用于准备可视化数据的世界一流的SQL集成开发环境,内置一个丰富的元数据浏览器
- 一个轻量级的语义层级,使数据分析师可以快速定义自定义维度和指标。
- (开箱即用的)支持大多数使用SQL的数据库
- 无缝的、内存的异步缓存和查询
- 可扩展的安全模型
- 允许配置复杂的规则来控制谁可以接入哪一个产品的特征和数据集
- 集成了主要的身份认证后端框架(数据库、OpenID、LDAP、OAuth、REMOTE_USER等)
- 添加自定义可视化插件的能力
- 可编程定制的API
- 为度量全新设计的云原生架构
Superset被设计为高可用的云原生应用。它被设计来扩展大规模分布式环境,而且在容器内运行效果非常好。虽然你可以轻松地在适当的设置或简单地在您的笔记本上测试启动Superset,但是它对扩展平台却几乎没有限制。
Superset作为云原生应用的另一重含义是它很灵活,可以让您自己选择:
- Web服务器(Gunicorn、Nginx、Apache)
- 元数据数据库引擎(MySQL、Postgres、MariaDB等)
- 消息队列(Redis、RabbitMQ、SQS等)
- Results Backend(S3、Redis、Memcached等)
- 缓存层(Memcached、Redis等)
Superset和诸如NewRelic、StatsD和DataDog的服务也能很好的一起工作,而且它能够根据最流行的数据库技术运行分析性的工作负载。
Superset目前在很多公司大规模运行。例如,Superset现在运行在Airbnb的Kubernetes生产环境中,每天服务600位以上的活跃用户浏览超过10万张的图表。
你可以在Github的这个页面找到部分包含Superset的工业和公司名单。