大数据课程L5——网站流量项目的实时业务系统搭建

本文介绍了如何搭建一个网站流量项目的实时业务系统,通过Flume收集数据并传输到Kafka,详细阐述了从启动Zookeeper和Kafka集群,配置Flume agent,到创建Kafka主题,最后测试数据流动的完整过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

文章作者邮箱:yugongshiye@sina.cn              地址:广东惠州

 ▲ 本章节目的

⚪ 掌握网站流量项目的 Flume—>Kafka 连通;

⚪ 掌握网站流量项目的实时业务系统搭建;

一、Flume—>Kafka 连通

1. 实现步骤

1. 启动三台服务器。

2. 启动 Zookeeper 集群。

执行指令:

sh /home/software/zookeeper-3.4.8/bin/zkServer.sh  start

3. 启动 Kafka 集群。

4. 创建 Kafka 主题。

执行指令:

sh kafka-topics.sh  --create  --zookeeper  hadoop01:2181

--replication-factor  1  --partitions  1  --topic  fluxdata

5. 启动 Hadoop。

6. 配置 flume 并启动。

在 flume 的 data 目录,执行如下指令:

../bin/flume-ng  agent  -n  a1  -c  ./  -f  ./weblog.conf

-Dflume.root.logger = INFO, console

weblog.conf配置文件示例如下:

a1.sources = r1

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值