基于 Ubuntu 玩转 Hudi Docker Demo (2)—— 测试数据写入 Kafka

14 篇文章 1 订阅
6 篇文章 1 订阅
本文详细介绍了如何在Ubuntu环境中利用Docker部署Hudi测试集群,并使用kafkacat工具将测试数据写入Kafka。首先,介绍了安装kafkacat的步骤,然后通过kafkacat检查和消费Kafka集群的信息,最后演示了如何将测试数据批量写入Kafka以及如何消费这些数据。
摘要由CSDN通过智能技术生成

基于 Ubuntu 玩转 Hudi Docker Demo 系列文章:
《基于 Ubuntu 玩转 Hudi Docker Demo (1)—— 集群安装》
《基于 Ubuntu 玩转 Hudi Docker Demo (2)—— 测试数据写入 Kafka》
《基于 Ubuntu 玩转 Hudi Docker Demo (3)—— Spark写入和查询》
《基于 Ubuntu 玩转 Hudi Docker Demo (4)—— Hive 查询 Hudi 表》

简介

上一篇文章《基于 Ubuntu 玩转 Hudi Docker Demo (1)—— 集群安装》 介绍了如何在 Ubuntu 安装 Docker, 编译 Hudi 源码 以及 使用 docker-compose 部署测试集群。

本文主要介绍如何把测试数据写入到 Kafka 集群。

工具

本文使用 kafkacat 来生产、消费、查看元数据。
在 Ubuntu 在通过以下命令安装:

sudo apt update
sudo apt get install kafkacat

kafkacat 详细介绍可见 《Kafka 命令行工具 kcat/kafkacat》

检查/etc/hosts 文件

确保 /etc/hosts 文件有以下配置:

127.0.0.1 adhoc-1
127.0.0.1 adhoc-2
127.0.0.1 namenode
127.0.0.1 datanode1
127.0.0.1 hiveserver
127.0.0.1 hivemetastore
127.0.0.1 kafkabroker
127.0.0.1 sparkmaster
127.0.0.1 zookeeper

在这里插入图片描述

测试数据

在 hudi 源码目录下有两个测试数据文件:

在这里插入图片描述

测试数据写入 Kafka

1. 查看当前 kafka 集群信息
kafkacat -b kafkabroker -L -J | jq .

在这里插入图片描述

2. 生产数据
cat docker/demo/data/batch_1.json | kafkacat -b kafkabroker -t stock_ticks -P

在这里插入图片描述

3. 查看当前 kafka 集群信息
kafkacat -b kafkabroker -L -J | jq .

在这里插入图片描述

4. 消费数据

消费10条数据

 kafkacat -C -b kafkabroker -t stock_ticks -p 0 -o -10

在这里插入图片描述

至此,测试数据已写入到 Kafka

下一篇:《基于 Ubuntu 玩转 Hudi Docker Demo (3)—— Spark写入和查询》

要在Docker中安装Hudi,可以按照以下步骤进行操作: 1. 首先,确保您已经安装了DockerDocker Compose。您可以从Docker官方网站上下载并安装它们。 2. 创建一个新的目录来存储HudiDocker配置文件和示例代码。例如,可以创建一个名为"hudi-docker"的目录并进入其中: ``` mkdir hudi-docker cd hudi-docker ``` 3. 在"hudi-docker"目录中创建一个名为"docker-compose.yml"的文件,并使用文本编辑器打开它: ``` touch docker-compose.yml nano docker-compose.yml ``` 4. 在打开的文件中,粘贴以下内容作为Docker Compose配置: ```yaml version: '3' services: hudi: image: apache/hudi ports: - 8888:8888 volumes: - ./data:/root/data command: "sh -c 'sleep 10 && jupyter notebook --no-browser --ip=0.0.0.0 --allow-root'" ``` 这个配置将使用Apache Hudi的官方Docker镜像,并将端口8888映射到主机的8888端口。它还将创建一个名为"data"的卷,用于在容器内和主机之间共享数据。 5. 保存并关闭文件。 6. 在"hudi-docker"目录中使用以下命令启动Docker容器: ``` docker-compose up ``` 这将下载HudiDocker镜像并启动一个名为"hudi"的容器。 7. 当容器启动后,您可以通过访问http://localhost:8888来访问Jupyter Notebook。可以在其中运行Hudi的示例代码和教程。 请注意,这只是一个简单的示例,用于在Docker中快速启动Hudi。根据您的实际需求,可能需要进行更多的配置和调整。您可以根据Hudi的官方文档进一步了解如何在Docker中使用Hudi,并根据需要进行自定义配置。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

修破立生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值