在3个节点的cdh5.14.4上进行kylin2.4.1 搭建

最新推荐文章于 2019-05-05 09:56:07 发布

yostkevin

最新推荐文章于 2019-05-05 09:56:07 发布

阅读量390

点赞数

分类专栏：大数据文章标签： kylin

本文链接：https://blog.csdn.net/u014384314/article/details/83068176

版权

大数据专栏收录该内容

33 篇文章 0 订阅

订阅专栏

1. 官网：

http://kylin.apache.org/cn/docs24/install/

2.下载地址：

https://archive.apache.org/dist/kylin/apache-kylin-2.4.1/

3.在一个节点（slave02）创建目录并将安装包解压

mkdir /usr/local/apps/

#通过xshell6将下载的压缩包 上传到该目录
tar -zxvf apache-kylin-2.4.1-bin-cdh57.tar.gz
cd apache-kylin-2.4.1-bin
[root@master01 bin]# vim /etc/profile
export KYLIN_HOME=/usr/local/apps/apache-kylin-2.4.1-bin

#环境生效
source /etc/profile

4.将用户切换到hdfs，以有权限在Hdfs创建相关的kylin目录

vim $KYLIN_HOME/bin/check-env.sh

#hadoop ${hadoop_conf_param} fs -mkdir -p $WORKING_DIR
sudo -u hdfs hadoop ${hadoop_conf_param} fs -mkdir -p $WORKING_DIR

#    hadoop ${hadoop_conf_param} fs -mkdir -p $SPARK_EVENTLOG_DIR
     sudo -u hdfs hadoop ${hadoop_conf_param} fs -mkdir -p $SPARK_EVENTLOG_DIR


#    hadoop ${hadoop_conf_param} fs -mkdir -p $SPARK_HISTORYLOG_DIR
     sudo -u hdfs hadoop ${hadoop_conf_param} fs -mkdir -p $SPARK_HISTORYLOG_DIR

5.执行检查命令确保用户有权限在 shell 中运行 hadoop, hive 和 hbase cmd，查看是否目录创建成功，不报错即成功

[root@slave02 bin]# $KYLIN_HOME/bin/check-env.sh
Retrieving hadoop conf dir...
KYLIN_HOME is set to /usr/local/apps/apache-kylin-2.4.1-bin
[root@slave02 bin]#

6.启动单节点Kylin

# $KYLIN_HOME/bin/kylin.sh start

7.访问

http://slave02:7070/kylin/login ;初始用户名和密码是 ADMIN/KYLIN。

8. 停止 kylin

[root@slave02 bin]#  $KYLIN_HOME/bin/kylin.sh stop
Retrieving hadoop conf dir...
KYLIN_HOME is set to /usr/local/apps/apache-kylin-2.4.1-bin
Stopping Kylin: 49468
Kylin with pid 49468 has been stopped.

二。在单节点基础上多节点kylin 部署

2.1 在master01,slave01节点同上进行配置

2.2 修改各个节点的kylin.properties 中的部分配置

[root@slave02 conf]# pwd
/usr/local/apps/apache-kylin-2.4.1-bin/conf
[root@slave02 conf]# vim kylin.properties 

## Kylin server mode, valid value [all, query, job]
kylin.server.mode=all
#
## List of web servers in use, this enables one web server instance to sync up with other servers.
kylin.server.cluster-servers=slave02:7070,slave01:7070,master01:7070

[root@slave01 conf]# vim kylin.properties 

## Kylin server mode, valid value [all, query, job]
kylin.server.mode=query
#
## List of web servers in use, this enables one web server instance to sync up with other servers.
kylin.server.cluster-servers=slave02:7070,slave01:7070,master01:7070

[root@master01 conf]# vim kylin.properties 

## Kylin server mode, valid value [all, query, job]
kylin.server.mode=query
#
## List of web servers in use, this enables one web server instance to sync up with other servers.
kylin.server.cluster-servers=slave02:7070,slave01:7070,master01:7070

kylin.server.mode=all,job,query (这个决定了当前kylin节点所担任的角色，一个Kylin集群只能有一台作业引擎，也即只能有一台节点的这个配置项目为all或者job ，可以有多台query节点)

kylin.server.cluster-servers=slave02:7070,slave01:7070,master01:7070（这个配置项是Kylin用来同步各个节点的状态的，否则负载均衡下面跳转到不同的页面看到的不一致）

2.3 所有节点启动

# $KYLIN_HOME/bin/kylin.sh start

2.4 访问（slave02 作为作业引擎，kylin.server.mode=all）

http://slave02:7070/kylin/login ;初始用户名和密码是 ADMIN/KYLIN。

安装完成~~~

三. 运行官方测试数据

3.1

[root@slave02 bin]# pwd
/usr/local/apps/apache-kylin-2.4.1-bin/bin
[root@slave01 bin]# sh sample.sh

3.2

3.3

3.4 为非hdfs用户授写权限

[root@slave02 bin]# su hdfs
bash: /var/lib/hadoop-hdfs/.bashrc: 权限不够
bash-4.2$ hdfs dfs -chmod -R 777 /kylin
bash-4.2$ su
密码：
[root@slave02 bin]# hdfs dfs -ls /
Found 4 items
drwxr-xr-x   - hbase hbase               0 2018-10-16 08:48 /hbase
drwxrwxrwx   - hdfs  supergroup          0 2018-10-16 09:31 /kylin
drwxrwxrwt   - hdfs  supergroup          0 2018-10-16 10:51 /tmp
drwxr-xr-x   - hdfs  supergroup          0 2018-07-20 10:50 /user

3.5 在action 处选择resume（重新build），progress由pending 过了一会就变成running状态了

3.6 百分之百

3.7 Model 为ready 表示可以查询了

3.8 进行查询

可以明显感觉到查询速度非常快。

四. 自定义例子，使用kylin，构建多维索引，然后查询

4.1 创建 project

4.2 创建相关hive表：student,score (student.txt,score.txt 通过hue load 数据进 test数据库里面)

4.3 创建model

设置度量

五、例子2

全选

cube创建完之后，build的时候如果报下面错：

则将map的内存大小修改小一点，如下：

[root@slave02 conf]# pwd
/usr/local/apps/apache-kylin-2.4.1-bin/conf

[root@slave02 conf]# vim kylin_job_conf_inmem.xml
  
 <!--Additional config for in-mem cubing, giving mapper more memory -->
    <property>
        <name>mapreduce.map.memory.mb</name>
        <!--<value>3072</value> -->
        <value>1024</value>
        <description></description>
    </property>