1、Apache Druid简介
Apache Druid是一个实时分析型数据库,旨在对大型数据集进行快速的查询分析("OLAP"查询)。Druid最常被当做数据库来用以支持实时摄取、高性能查询和高稳定运行的应用场景,同时,Druid也通常被用来助力分析型应用的图形化界面,或者当做需要快速聚合的高并发后端API,Druid最适合应用于面向事件类型的数据。
Druid通常应用于以下场景:
- 点击流分析(Web端和移动端)
- 网络监测分析(网络性能监控)
- 服务指标存储
- 供应链分析(制造类指标)
- 应用性能指标分析
- 数字广告分析
- 商务智能 / OLAP
更为详细介绍请查看:Druid是什么
2、Apache Druid安装
Apache Druid官网下载地址
说明一下,我下载的版本是:apache-druid-0.20.0-bin.tar.gz
2.1 进入到/usr/local/目录,将apache-druid-0.20.0-bin.tar.gz安装文件上传到/usr/local/目录,将解压
# 进入/usr/local/目录
cd /usr/local/
# 解压
tar -zxvf apache-druid-0.20.0-bin.tar.gz
# 进入apache-druid-0.20.0目录
cd apache-druid-0.20.0
# 将zk2181端口改为3181 (单机版apache druid自带zk,zk默认的2181端口会与我们kafka的zk的端口冲突,所以改为3181)
sed -i "s/2181/3181/g" `grep 2181 -rl ./`
# 将zk2181端口改为3181
sed -i "s/druid.zk.service.host=localhost/druid.zk.service.host=localhost:3181/g" `grep druid.zk.service.host=localhost -rl ./`
# 修改Druid的时区
sed -i "s/Duser.timezone=UTC/Duser.timezone=UTC+8/g" `grep Duser.timezone=UTC -rl ./`<