今天在安装kylin与superset过程中,遇到两个大坑,在下面的安装过程中有详细讲解。首先简单介绍一下这两个组件:
Superset 是一个数据探索和可视化平台,设计用来提供直观的,可视化的,交互式的分析体验。
Superset 提供了两种分析数据源的方式:
1. 用户可以以单表形式直接查询多种数据源,包括 Presto、Hive、Impala、SparkSQL、MySQL、Postgres、Oracle、Redshift、SQL Server、Druid 等。本文后续内容也会详细介绍Superset如何支持Kylin数据源。
2. 一个 SQL 的 IDE 供高级分析师使用 SQL 查询定义所需要分析的数据集,这种方法使用户在一个查询中实现用 Superset 查询数据源的多表,并立即对查询进行可视化分析。
kylin是一个OLAP的查询分析引擎,主要思想是预计算,号称可以达到毫秒甚至亚秒级的查询速度,
关于这两个组件详细信息,请自行移步至百度。
下面讲讲superset集成kylin中遇到的坑:
1. 安装 Apache Kylin
请参考 Apache Kylin installation guide:http://kylin.apache.org/docs23/
2. Apache Kylin 提供了样例 Cube,方便大家学习使用。Kylin 启动成功后,可以在 Kylin 安装路径下运行以下命令生成样例数据 Cube:
./${KYLIN_HOME}/bin/sample.sh
运行后,使用默认的 Kylin 账号 ADMIN / KYLIN 登陆界面,在 System 页面点击 Reload