基于 Ubuntu 玩转 Hudi Docker Demo （2）—— 测试数据写入 Kafka

修破立生

已于 2022-02-12 21:46:51 修改

阅读量1.5k

点赞数

分类专栏：湖仓 Kafka Hudi 文章标签： ubuntu kafka docker 大数据 big data

于 2022-02-10 18:12:15 首次发布

本文链接：https://blog.csdn.net/weixin_47298890/article/details/122865643

版权

湖仓同时被 3 个专栏收录

19 篇文章 1 订阅

订阅专栏

Hudi

14 篇文章 1 订阅

订阅专栏

Kafka

6 篇文章 1 订阅

订阅专栏

本文详细介绍了如何在Ubuntu环境中利用Docker部署Hudi测试集群，并使用kafkacat工具将测试数据写入Kafka。首先，介绍了安装kafkacat的步骤，然后通过kafkacat检查和消费Kafka集群的信息，最后演示了如何将测试数据批量写入Kafka以及如何消费这些数据。

摘要由CSDN通过智能技术生成

基于 Ubuntu 玩转 Hudi Docker Demo 系列文章：
《基于 Ubuntu 玩转 Hudi Docker Demo （1）—— 集群安装》
《基于 Ubuntu 玩转 Hudi Docker Demo （2）—— 测试数据写入 Kafka》
《基于 Ubuntu 玩转 Hudi Docker Demo （3）—— Spark写入和查询》
《基于 Ubuntu 玩转 Hudi Docker Demo （4）—— Hive 查询 Hudi 表》

简介

上一篇文章《基于 Ubuntu 玩转 Hudi Docker Demo （1）—— 集群安装》介绍了如何在 Ubuntu 安装 Docker，编译 Hudi 源码以及使用 docker-compose 部署测试集群。

本文主要介绍如何把测试数据写入到 Kafka 集群。

工具

本文使用 kafkacat 来生产、消费、查看元数据。
在 Ubuntu 在通过以下命令安装：

sudo apt update
sudo apt get install kafkacat

kafkacat 详细介绍可见《Kafka 命令行工具 kcat/kafkacat》

检查/etc/hosts 文件

确保 /etc/hosts 文件有以下配置：

127.0.0.1 adhoc-1
127.0.0.1 adhoc-2
127.0.0.1 namenode
127.0.0.1 datanode1
127.0.0.1 hiveserver
127.0.0.1 hivemetastore
127.0.0.1 kafkabroker
127.0.0.1 sparkmaster
127.0.0.1 zookeeper

在这里插入图片描述

测试数据

在 hudi 源码目录下有两个测试数据文件：

在这里插入图片描述

测试数据写入 Kafka

1. 查看当前 kafka 集群信息

kafkacat -b kafkabroker -L -J | jq .

在这里插入图片描述

2. 生产数据

cat docker/demo/data/batch_1.json | kafkacat -b kafkabroker -t stock_ticks -P

在这里插入图片描述

3. 查看当前 kafka 集群信息

kafkacat -b kafkabroker -L -J | jq .

在这里插入图片描述

4. 消费数据

消费10条数据

 kafkacat -C -b kafkabroker -t stock_ticks -p 0 -o -10

在这里插入图片描述

至此，测试数据已写入到 Kafka

下一篇：《基于 Ubuntu 玩转 Hudi Docker Demo （3）—— Spark写入和查询》

修破立生

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录