使用SparkStreaming+Kafka+Flume的实现wordcount一个简单的小项目

最新推荐文章于 2022-09-05 21:46:15 发布

kClown1

最新推荐文章于 2022-09-05 21:46:15 发布

阅读量469

点赞数

文章标签： Flume+Kafka+SparkStreamming

本文链接：https://blog.csdn.net/qq_43227570/article/details/82817882

版权

使用SparkStreaming+Kafka+Flume的一个简单的小项目

整体架构用Flume采集数据源下沉到Kafak中，再用SparkStreamming对数据做一个简单的WordCount;
下面是具体代码：
1.Flume的conf的配置

#为我们的source channel sink起名
a1.sources=r1
a1.channels=c1
a1.sinks=k1
#指定我们的source收集到数据发送到哪个管道
a1.sources.r1.channels=c1
#指定source的收集策略#exec表示可以执行linux的command命令
a1.sources.r1.type=exec
a1.sources.r1.command=tail -F /root/flume/logs
a1.sources.r1.inputCharset=utf-8
#指定下沉地kafak
a1.sinks.k1.channel = c1
a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
#指定topic的
a1.sinks.k1.kafka.topic = wordcount
#指定kafak的集群
a1.sinks.k1.kafka.bootstrap.servers = node-01:9092,node-02:9092,node-03:9092
#指定一批中要处理的数据大小
a1.sinks.k1.kafka.flumeBatchSize = 20
#开启ack机制
a1.sinks.k1.kafka.producer.acks = 1
#指定管道是memory
a1.channels.c1.type=memory

2启动命令：bin/flume-ng agent -c conf -f conf/tailfile_kafak.conf

最低0.47元/天解锁文章

kClown1

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
使用SparkStreaming+Kafka+Flume的实现wordcount一个简单的小项目

使用SparkStreaming+Kafka+Flume的一个简单的小项目整体架构用Flume采集数据源下沉到Kafak中，再用SparkStreamming对数据做一个简单的WordCount;下面是具体代码：1.Flume的conf的配置#为我们的source channel sink起名a1.sources=r1a1.channels=c1a1.sinks=k1#指定我们的s...
复制链接

扫一扫