说起 Druid,大家首先想到的是阿里的 Druid 数据库连接池,而本文介绍的 Druid 是一个在大数据场景下的解决方案,是需要在复杂的海量数据下进行交互式实时数据展现的 BI/OLAP 工具。它有三个特点:处理的数据量规模较大。
可以进行数据的实时查询展示。
它的查询模式是交互式的,这也说明其查询并发能力有限。
imply集成了Druid,提供了Druid从部署到配置到各种可视化工具的完整的解决方案,imply有点类似于我们之前学过的Cloudera Manager
1)将imply-2.7.10.tar.gz上传到hadoop102的/opt/software目录下,并解压
$ tar -zxvf imply-2.7.10.tar.gz -C /opt/module
2)修改/opt/module/imply-2.7.10名称为/opt/module/imply
$ mv imply-2.7.10/ imply
(1)修改Druid的ZK配置
vi opt/module/imply/conf/druid/_common/
common.runtime.properties
druid.zk.service.host=hadoop102:2181,hadoop103:2181,hadoop104:2181
修改启动命令参数,使其不校验不启动内置ZK
$ vim /opt/module/imply/conf/supervise/quickstart.conf
:verify bin/verify-java
#:verify bin/verify-default-ports
#:verify bin/verify-version-check
:kill-timeout 10
#!p10 zk bin/run-zk conf-quickstart
(1)启动Zookeeper
zk.sh start
)启动imply
$ bin/supervise -c conf/supervise/quickstart.conf