Centos7服务器安装Apache Druid,以及文件数据摄入、kafka实时数据流摄入

本文详细介绍了如何在Centos7服务器上安装Apache Druid,包括从下载到启动的步骤。接着,通过实例演示了如何摄入本地文件数据和Kafka实时数据流,确保数据正确导入并可查询。Apache Druid适用于实时分析和快速查询大型数据集,适合用于多种场景,如点击流分析、服务指标存储等。
摘要由CSDN通过智能技术生成

1、Apache Druid简介

Apache Druid是一个实时分析型数据库,旨在对大型数据集进行快速的查询分析("OLAP"查询)。Druid最常被当做数据库来用以支持实时摄取、高性能查询和高稳定运行的应用场景,同时,Druid也通常被用来助力分析型应用的图形化界面,或者当做需要快速聚合的高并发后端API,Druid最适合应用于面向事件类型的数据。

Druid通常应用于以下场景:

  • 点击流分析(Web端和移动端)
  • 网络监测分析(网络性能监控)
  • 服务指标存储
  • 供应链分析(制造类指标)
  • 应用性能指标分析
  • 数字广告分析
  • 商务智能 / OLAP
    更为详细介绍请查看:Druid是什么

2、Apache Druid安装

Apache Druid官网下载地址
说明一下,我下载的版本是:apache-druid-0.20.0-bin.tar.gz

2.1 进入到/usr/local/目录,将apache-druid-0.20.0-bin.tar.gz安装文件上传到/usr/local/目录,将解压

# 进入/usr/local/目录
cd /usr/local/

# 解压
tar -zxvf apache-druid-0.20.0-bin.tar.gz

# 进入apache-druid-0.20.0目录
cd apache-druid-0.20.0

# 将zk2181端口改为3181 (单机版apache druid自带zk,zk默认的2181端口会与我们kafka的zk的端口冲突,所以改为3181)
sed -i "s/2181/3181/g" `grep 2181 -rl ./`

# 将zk2181端口改为3181 
sed -i "s/druid.zk.service.host=localhost/druid.zk.service.host=localhost:3181/g" `grep druid.zk.service.host=localhost -rl ./`

# 修改Druid的时区
sed -i "s/Duser.timezone=UTC/Duser.timezone=UTC+8/g" `grep Duser.timezone=UTC -rl ./`<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值