官网:http://kylin.apache.org/cn/
搭建
下载kylin
在CDH head2节点部署kylin
wget https://mirrors.tuna.tsinghua.edu.cn/apache/kylin/apache-kylin-3.1.2/apache-kylin-3.1.2-bin-cdh60.tar.gz
并解压到 /kylin目录
部署
bin/set-java-home.sh 可以修改java-home
bin/check-env.sh
保证所有环境都是pass 状态
启动:bin/kylin.sh start
打开web 页面 http://192.19.18.2:7070/kylin
用户名:ADMIN 密码:KYLIN (用户名密码都是大写)
报错:java.lang.ClassCastException: com.fasterxml.jackson.datatype.jsr310.JavaTimeModule cannot be cast to com.fasterxml.jackson.databind.Module
解决方案:下载依赖包放入指定路径
jackson-datatype-jdk8-2.10.0.jar
jackson-datatype-jsr310-2.10.0.jar
放入目录:/opt/kylin-3.1.0/tomcat/webapps/kylin/WEB-INF/lib
报错:
Error: Could not find or load main class org.apache.hadoop.hbase.util.GetJavaProperty
解决方案:
vim /opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/lib/hbase/bin/hbase
在169 行: 加上hbase lib
CLASSPATH="${HBASE_CONF_DIR}"
CLASSPATH=${CLASSPATH}:$JAVA_HOME/lib/tools.jar:/opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/lib/hbase/lib/*
vim /etc/profile
到最后加上:
export SPARK_HOME=/opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/lib/spark
export KAFKA_HOME=/opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/lib/kafka
export FLINK_HOME=/opt/cloudera/parcels/FLINK/lib/flink
export KYLIN_HOME=/opt/bigdata/apache-kylin-3.1.0-bin-cdh60
UI演示
新建项目
加载数据源
如下图所示,根据需要同步相应的表进来
新建模型
选择对应的项目,在model模块新建模型
下面选择要分析的维度,也就是需要group by的字段
选择分析的度量,也就是count sum的字段
指定hive表分区以及where条件
创建cube
选择参与计算的维度
选择参与计算的度量
对度量进行修改,即count sum 等字段选择
选择自动合并segment
高级属性: