Kafka数据到Hdfs

最新推荐文章于 2023-10-08 10:42:11 发布

aa1215018028

最新推荐文章于 2023-10-08 10:42:11 发布

阅读量1.6k

点赞数

文章标签： Kafka HDFS Kafka同步数据到HDFS

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aa1215018028/article/details/100033692

版权

找时间总结整理了下数据从Kafka到Hdfs的一些pipeline，如下

1> Kafka -> Flume –> Hadoop Hdfs

常用方案,基于配置,需要注意hdfs小文件性能等问题.

GitHub地址: https://github.com/apache/flume

2> Kafka -> Kafka Hadoop Loader ->Hadoop Hdfs

Kafka Hadoop Loader通过为kafka Topic下每个分区建立对应的split来创建task实现增量的加载数据流到hdfs,上次消费的partition offset是通过zookeeper来记录的.简单易用.

GitHub地址: https://github.com/michal-harish/kafka-hadoop-loader

3> Kafka -> KaBoom -> Hadoop Hdfs

KaBoom是一个借助Krackle(开源的kafka客户端，能极大的减少对象的创建，提高应用程序的性能)来消费kafka的Topic分区数据随后写如hdfs,利用Curator和Zookeeper来实现分布式服务,能够灵活的根据topic来写入不同的hdfs目录.

GitHub地址: https://github.com/blackberry/KaBoom

4> Kafka -> Kafka-connect-hdfs -> Hadoop Hdfs

Confluent的Kafka Connect旨在通过标准化如何将数据移入和移出Kafka来简化构建大规模实时数据管道的过程。可以使用Kafka Connect读取或写入外部系统，管理数据流并扩展系统，而无需编写新代码.

GitHub地址: https://github.com/confluentinc/kafka-connect-hdfs

5> Kafka -> Gobblin -> Hadoop Hdfs

Gobblin是LinkedIn开源的一个数据摄取组件.它支持多种数据源的摄取，通过并发的多任务进行数据抽取，转换，清洗，最终加载到目标数据源.支持单机和Hadoop MR二种方式，而且开箱即用，并支持很好的扩展和二次开发.

GitHub地址: https://github.com/linkedin/gobblin

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
Kafka数据到Hdfs

找时间总结整理了下数据从Kafka到Hdfs的一些pipeline，如下1> Kafka -> Flume –> Hadoop Hdfs常用方案,基于配置,需要注意hdfs小文件性能等问题.GitHub地址:https://github.com/apache/flume2> Kafka -> Kafka Hadoop Loader ->Had...
复制链接

扫一扫

博客等级

码龄13年

412
原创

542
点赞

2495
收藏

471
粉丝

关注

私信

热门文章

分类专栏

ES 4篇
微服务 28篇
运维相关 13篇
Centos7 23篇
消息中间件 33篇
java相关 119篇
Redis 14篇
Netty 14篇
Spring 43篇
Docker 21篇
Mybatis 11篇
架构之路 41篇
接口测试 9篇
Kubernetes 12篇
业务处理 5篇
分布式系统 21篇
数据库 53篇
GO 10篇
JVM 3篇
物联网 20篇
时序 44篇
大數據 24篇

最新评论

Hive学习实例
m0_67918989: 想问问您用的什么软件写的hive啊
CentOS7下安装和运行Keepalived
丑态念: 下一章在哪呢？？？？？？？？？？
Netty原理解析
单洪峰: 写的什么东西这是，思路一点也不清晰，请不要为了写博客，而写博客。你自己反过来在看，你能看懂吗？误人子弟
Kong源码导读
waterorblue: 想问你找到了吗？我也不知道怎么调试，现在都是写好，直接部署请求的方式调试。
Mqtt Qos 深度解读
一起卖代码: 即使再多几次，在极端情况也会存在重复，只是概率问题

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。