apache kylin4.0安装与使用

Apache Kylin 4.0通过使用HDFS Parquet文件和Spark 3.1实现性能和稳定性显著提升。本文档详细介绍了Kylin 4.0的安装过程,包括环境配置、软件依赖、安装步骤以及解决遇到的各种问题,如Hive兼容性、资源冲突等,旨在帮助用户顺利进行Kylin 4.0的部署和使用。
摘要由CSDN通过智能技术生成

apache kylin4.0安装与使用

kylin4.0优势

kylin4.0架构大调整,去除了Hbase,改用hdfs parquet文件作为底层数据存储层,无需指标rowkey编码

计算及查询引擎统一,采用spark,支持spark3.1,所以cube计算查询效率比kylin3.0直接提升一倍,稳定性也高很多

存储的cube计算数据占用空间比hbase少一倍

简单查询跟3.x版本性能差不多,但对应复杂查询,性能成倍数提升(parquet及目录分区过滤)

综上,随着kylin4.0稳定版本发布,没有不升级的理由

官方文档:https://kylin.apache.org/cn/docs/

软件环境

  1. OS ubuntu18.04 server虚拟机单机
  2. java 8
  3. scala 2.12
  4. mysql 8.0
  5. apache hadoop2.10
  6. apache hive 2.3.9
  7. apache zookeeper 3.5
  8. apache spark 3.1.2-hadoop-2.7

官网下载

点击查看版本支持,为啥用hadoop2.10不用3.x,因为试过了kylin和hive3.x版本不兼容!!!,官方kylin环境hive最高支持到2.3.9,而hive2.x与hadoop2.x对应

下载当前最新版 apache-kylin-4.0.0-bin-spark3.tar.gz

解压至服务器安装目录

依赖软件服务

  • hadoop hdfs
  • hadoop yarn
  • hive metastore
  • zookeeper
  • mysql

以上软件服务都要提前安装部署好,这里不多bb

软件安装

配置KYLIN_HOME环境变量,HBASE_HOME可忽略

/etc/profile

export JAVA_HOME=/opt/jdk1.8.0_301
export MAVEN_HOME=/opt/apache-maven-3.8.2
export SCALA_HOME=/opt/scala-2.12.14
export HADOOP_HOME=/opt/hadoop-2.10.1
export HIVE_HOME=/opt/apache-hive-2.3.9-bin
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export SPARK_HOME=/opt/spark-3.1.2-bin-hadoop2.7
export KYLIN_HOME=/opt/apache-kylin-4.0.0-bin-spark3
export HBASE_HOME=/opt/hbase-2.2.3
export PATH=$PATH:$JAVA_HOME/bin:$MAVEN_HOME/bin:$SCALA_HOME/bin:$HADOOP_HOME/bin:$HIVE_HOME/bin:$SPARK_HOME/bin:$KYLIN_HOME/bin:$HBASE_HOME/bin

source /etc/profile

启动依赖的软件服务

  • hadoop
  • hive metastore
  • zookeeper
  • mysql

配置kylin

vim $KYLIN_HOME/conf/kylin.properties

h1是我虚拟机主机名

#kylin mysql metadata元数据库配置
kylin.metadata.url=kylin_metadata@jdbc,url=jdbc:mysql://h1:3306/kylin,username=hive,password=hive,maxActive=10,maxIdle=10
#zookeeper配置
kylin.env.zookeeper-connect-string=h1
kylin.server.cluster-servers=h1:7070
#计算引擎默认资源配置
kylin.engine.spark-conf.spark.master=yarn
kylin.engine.spark-conf.spark.submit.deployMode=client
kylin.engine.spark-conf.spark.yarn.queue=default
kylin.engine.spark-conf.spark.executor.cores=1
kylin.engine.spark-conf.spark.executor.memory=512M
kylin.engine.spark-conf.spark.executor.instances=1
kylin.engine.spark-conf.spark.executor.memoryOverhead=256M
kylin.engine.spark-conf.spark.driver.cores=1
kylin.engine.spark-conf.spark.driver.memory=512M
kylin.engine.spark-conf.spark.driver.memoryOverhead=256M
#查询引擎默认资源配置
kylin.query.auto-sparder-context-enabled-enabled=true
kylin.query.sparder-context.app-name=kylin_query
kylin.query.spark-conf.spark.master=yarn
kylin.query.spark-conf.spark.submit.deployMode=client
kylin.query.spark-conf.spark.yarn.queue=default
kylin.query.spark-conf.spark.driver.cores=1
kylin.query.spark-conf.spark.driver.memory=512M
kylin.query.spark-conf.spark.driver.memoryOverhead=256M
kylin.query.spark-conf.spark.executor.cores=1
kylin.query.spark-conf.spark.executor.instances=1
kylin.query.spark-conf.spark.executor.memory=1G
kylin.query.spark-conf.spark.executor.memoryOverhead=256M

上传mysql-connector-java-8.0.26.jar连接驱动包到$KYLIN_HOME/ext/目录,目录没有自己创建,包自己到maven中央仓库页面下载

mysql中创建kylin.metadata.url指定的database,同时创建用户和数据库授权,不多bb

环境检测:执行脚本:$KYLIN_HOME/bin/ch

评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值