Kylin系列-使用Saiku+Kylin构建多维分析OLAP平台

最新推荐文章于 2019-06-21 16:33:37 发布

boat824109722

最新推荐文章于 2019-06-21 16:33:37 发布

阅读量1.3k

点赞数

分类专栏： kylin 大数据文章标签： kylin 大数据

大数据同时被 2 个专栏收录

32 篇文章 0 订阅

订阅专栏

kylin

11 篇文章 0 订阅

订阅专栏

关于Kylin的介绍和使用请参考之前的文章
《分布式大数据多维分析（OLAP）引擎Apache Kylin安装配置及使用示例》
Kylin对外提供的是SQL查询接口，基于Kylin构建OLAP多维分析系统，第一种方案是针对业务，定制开发一个前端界面，将界面上用户的选择和操作，翻译成SQL，提交给Kylin查询。另一种方案则是将Kylin与BI工具整合起来，借助BI工具，对Kylin中的Cube进行查询分析。Kylin本身对于BI工具Tableau可以非常好的整合使用，我自己下载了Tableau的试用版，效果确实不错，官方文档中也给出了详细的教程：

http://kylin.apache.org/cn/docs15/tutorial/tableau_91.html

kylin

可惜，Tableau是商业软件，收费的。

本文介绍另一个开源免费的BI工具–Saiku。
Saiku是一个轻量级的OLAP分析引擎，用户可以在非常友好的界面下利用OLAP和内存引擎进行向下钻取，过滤、分类、排序和生成图表。Saiku利用Mondrian完成了界面?MDX?SQL
的转换，最终将SQL通过JDBC提交给Kylin执行。

Github上已经有大神提供了编译好的相关jar包下载：

https://github.com/mustangore/kylin-mondrian-interaction

按照里面的说明，很简单就完成了Saiku+Kylin的整合部署。

Saiku中配置Kylin数据源

在浏览器输入Saiku的WEB地址：http://172.16.212.17:8080/
用户名密码为:admin/admin

STEP1：编写Mondrian Schema文件

 
 <?xml version="1.0"?>
<Schema name="ad_schema">  
<Cube name="lxw1234_ad_cube2">  
    <!-- 事实表(fact table) -->  
    <Table name="AD_REPORT" />  
    <Dimension name="地域">  
        <Hierarchy hasAll="false">  
            <Table name="AD_REPORT"></Table>  
            <Level name="省份" column="PROVINCE" table="AD_REPORT"></Level>
            <Level name="城市" column="CITY" table="AD_REPORT"/>
        </Hierarchy> 
    </Dimension>  
  
    <Measure name="曝光数" column="IMP_PV" aggregator="sum" datatype="Integer" />
    <Measure name="唯一曝光数" column="COOKIEID_IMP" aggregator="distinct-count" datatype="Integer" />
    <Measure name="点击数" column="CLK_PV" aggregator="sum" datatype="Integer" />
    <Measure name="唯一点击数" column="COOKIEID_CLK" aggregator="distinct-count" datatype="Integer" />
</Cube>  
</Schema>