Centos7服务器安装Apache Druid，以及文件数据摄入、kafka实时数据流摄入

最新推荐文章于 2024-09-30 11:58:26 发布

蔚蓝色天空sky

最新推荐文章于 2024-09-30 11:58:26 发布

阅读量565

点赞数

分类专栏：分布式大数据文章标签： Apache Druid kafka 实时数据流 zookeeper

本文链接：https://blog.csdn.net/ytangdigl/article/details/115560814

版权

本文详细介绍了如何在Centos7服务器上安装Apache Druid，包括从下载到启动的步骤。接着，通过实例演示了如何摄入本地文件数据和Kafka实时数据流，确保数据正确导入并可查询。Apache Druid适用于实时分析和快速查询大型数据集，适合用于多种场景，如点击流分析、服务指标存储等。

摘要由CSDN通过智能技术生成

1、Apache Druid简介

Apache Druid是一个实时分析型数据库，旨在对大型数据集进行快速的查询分析（"OLAP"查询)。Druid最常被当做数据库来用以支持实时摄取、高性能查询和高稳定运行的应用场景，同时，Druid也通常被用来助力分析型应用的图形化界面，或者当做需要快速聚合的高并发后端API，Druid最适合应用于面向事件类型的数据。

Druid通常应用于以下场景：

点击流分析（Web端和移动端）
网络监测分析（网络性能监控）
服务指标存储
供应链分析（制造类指标）
应用性能指标分析
数字广告分析
商务智能 / OLAP
更为详细介绍请查看：Druid是什么

2、Apache Druid安装

Apache Druid官网下载地址
说明一下，我下载的版本是：apache-druid-0.20.0-bin.tar.gz

2.1 进入到/usr/local/目录，将apache-druid-0.20.0-bin.tar.gz安装文件上传到/usr/local/目录，将解压

# 进入/usr/local/目录
cd /usr/local/

# 解压
tar -zxvf apache-druid-0.20.0-bin.tar.gz

# 进入apache-druid-0.20.0目录
cd apache-druid-0.20.0

# 将zk2181端口改为3181 (单机版apache druid自带zk,zk默认的2181端口会与我们kafka的zk的端口冲突，所以改为3181)
sed -i "s/2181/3181/g" `grep 2181 -rl ./`

# 将zk2181端口改为3181 
sed -i "s/druid.zk.service.host=localhost/druid.zk.service.host=localhost:3181/g" `grep druid.zk.service.host=localhost -rl ./`

# 修改Druid的时区
sed -i "s/Duser.timezone=UTC/Duser.timezone=UTC+8/g" `grep Duser.timezone=UTC -rl ./`<

最低0.47元/天解锁文章