基于 Ubuntu 玩转 Hudi Docker Demo (1)—— 集群安装

14 篇文章 1 订阅

基于 Ubuntu 玩转 Hudi Docker Demo 系列文章:
《基于 Ubuntu 玩转 Hudi Docker Demo (1)—— 集群安装》
《基于 Ubuntu 玩转 Hudi Docker Demo (2)—— 测试数据写入 Kafka》
《基于 Ubuntu 玩转 Hudi Docker Demo (3)—— Spark写入和查询》
《基于 Ubuntu 玩转 Hudi Docker Demo (4)—— Hive 查询 Hudi 表》

简介

Apache Hudi 官网提供了一个基于 MacOS 的 Hudi Docker Demo, 那么其它操作系统的朋友是不是就没有机会玩了呢?答案是否定的。

接下来,笔者将会通过一系列文章介绍如何基于 Ubuntu 玩转 Hudi Docker Demo。

Windows 的用户可以先安装一个 Ubuntu 的虚拟机。 虚拟机工具有 VirtualBox/Vmware/Multipass 等,选择一款自己熟悉的即可。本文推荐使用 Multipass 《如何在 Windows 安装轻量级虚拟机工具 Multipass》

本文主要内容如下:

  • 环境准备,Docker,kafkacat, jp安装, /etc/hosts 文件修改等
  • Hudi 编译
  • 基于 Docker 搭建测试集群,包含 hdfs/hive/spark/presto 等组件

环境准备

环境信息:

Ubuntu 版本 20.04, JDK 1.8, Maven 3.6.3,Scala 2.11

1. Docker 安装
sudo apt-get update
sudo apt-get install docker docker-compose

docker 其它命令可以查看 《Ubuntu docker 笔记》, 包含启动、停止、修改 docker 下载源

2. kafkacat 安装

kafkacat 是一个 Kafka 命令行工具,用于生产和消费数据

sudo apt-get install kafkacat jp

kafkacat 详细介绍可见 《Kafka 命令行工具 kcat/kafkacat》

3. 修改/etc/hosts

添加以下配置

127.0.0.1 adhoc-1
127.0.0.1 adhoc-2
127.0.0.1 namenode
127.0.0.1 datanode1
127.0.0.1 hiveserver
127.0.0.1 hivemetastore
127.0.0.1 kafkabroker
127.0.0.1 sparkmaster
127.0.0.1 zookeeper

Hudi 编译

1. 下载 Hudi 源码
git clone -b release-0.10.1 https://github.com/apache/hudi.git

拉取 Hudi 0.10.1 版本的源码

2. 源码编译

进入源码目录,执行:

mvn package -DskipTests

在这里插入图片描述

编译完成:
在这里插入图片描述

基于 Docker 搭建测试集群

在 Hudi 源码编译的同时,可以同时搭建测试集群。
进入 Hudi 源码的 docker 目录, 执行命令:

sudo ./setup_demo.sh

这段命令会拉去 docker 镜像,并启动 docker 容器。
在这里插入图片描述

在这里插入图片描述

执行成功后,查看运行中的 docker 容器:

sudo docker ps

在这里插入图片描述

至此,基于 Docker 容器的测试集群搭建完毕。

下一篇,《基于 Ubuntu 玩转 Hudi Docker Demo (2)—— 测试数据写入 Kafka 》

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

修破立生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值