flume如何向kafka写数据

最新推荐文章于 2021-01-14 15:42:28 发布

jsky_studio

最新推荐文章于 2021-01-14 15:42:28 发布

阅读量1.9k

点赞数

分类专栏： Kafka 文章标签： kafka flume storm 实时计算消息队列中间件

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jsky_studio/article/details/41494069

版权

Kafka 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

介绍整合flume和kafka的文章很多。

最近正好学习并动手实践了一回，记下自己的一些心得。

Flume简介

flume是 Cloudera 开发的实时日志收集系统。

她包含三个重要组件，就是source(采集读入数据)， sink(输出数据）和channel（source和sink之间的buffer)。

值得一提的是， flume支持一个source采集数据，并通过多个channel发送至多个sink，配置样例见下文链接。

个人感觉开发者是希望分布式的实时日志采集变得更加简单，用户只需通过配置甚至不需要开发代码，就可以实现日志采集。

同时，还有很重要的一点，Flume比较适合分布式扩展，这对成长迅速的大型分布式系统比较有利。

大家可以参考如下一片文章进一步学习Flume: Flume NG 简介及配置实战

整合Flume和Kafka:

总的来说需要如下几步：

1> 安装好Flume

2> 下载第三方的或自己写flume kafka sink, 编译成jar包，放入flume/lib/目录下

3> 配置Flume安装目录下的conf / XXX.properties （就是定义自己的flume source, channel 和 sink），注意 sink的类型就是<2>中自己定义的sink类全名（package.class)

4> 下载kafka安装包，将 kafka/lib/下的所有jar包都copy至 flume/lib/目录下

5> 启动flume, 验证是否成功（可能碰到的问题包括scala版本问题，kafka jar包的版本问题和sfj多版本冲突等）

本周内会继续将如上内容补充完整，争取能给刚上手的同学更多帮助。

IT人的微信自媒体--- 杰天空，走在寻找创意的路上
发掘创意，点缀生活，品味人生。
请搜索微信订阅号： jksy_studio ，或者微信扫描下图二维码添加关注

杰天空静候您的光临。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
flume如何向kafka写数据

介绍整合flume和kafka的文章很多。最近正好学习并动手实践了一回，记下自己的一些心得。Flume简介flume是 Cloudera 开发的实时日志收集系统。她包含三个重要组件，就是source(采集读入数据)， sink(输出数据）和channel（source和sink之间的buffer)。值得一提的是， flume支持一个source采集数据，并通过多个c
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。