数据湖工具hudi docker demo安装与使用

数据湖工具hudi docker demo安装与使用

一、hudi介绍

二、环境准备

  • jdk

  • maven

  • docker

  • docker-compose

  • kcat

  • jq

    yum -y install jq
    
  • 增加host

    #该演示通过主机名引用了容器中运行的许多服务。将以下设置添加到 /etc/hosts
    vim /etc/hosts
      
    127.0.0.1 adhoc-1
    127.0.0.1 adhoc-2
    127.0.0.1 namenode
    127.0.0.1 datanode1
    127.0.0.1 hiveserver
    127.0.0.1 hivemetastore
    127.0.0.1 kafkabroker
    127.0.0.1 sparkmaster
    127.0.0.1 zookeeper
    

三、安装hudi

  • 拉取源码

    #github拉取
    git clone https://github.com/apache/hudi.git
    #镜像拉取
    git clone https://ghproxy.com/github.com/apache/hudi.git
    
  • 打包源码

    cd /opt/software/hudi
    mvn clean package -Pintegration-tests -DskipTests
    
  • 运行启动脚本

    cd /opt/software/hudi/docker
    ./setup_demo.sh
    #启动完成后,查看docker容器运行状况
    docker ps
    

四、问题与解决

  1. 也许你正在使用jre环境,而不是jdk,属于jdk环境变量问题。
    • 报错如下图:
      在这里插入图片描述

    • 解决办法:

    #如果有jdk,那就跳过安装,直接配置jdk环境变量
    #如果没有则可以照第一步安装jdk,并且配置jdk环境变量
    
  2. aliyun的maven仓库里找不到io.confluent 下的几个jar包
    • 报错如下图:
      在这里插入图片描述
    • 解决办法:
    #前往maven仓库下载对应的jar包放入本地仓库的文件夹里,一般存于maven下的localRepo文件夹下
    cd /opt/software/maven3.9/localRepo/
    #先查看lastUpdate文件
    find ./ -name *.lastUpdate
    #删除所有
    find ./ -type f -name "*lastUpdate" -delete
    #重新下载jar包,并放入对应目录,下面是下载链接
    https://mvnrepository.com/artifact/io.confluent/kafka-avro-serializer/5.3.4
    https://mvnrepository.com/artifact/io.confluent/kafka-schema-registry-client/5.3.4
    https://mvnrepository.com/artifact/io.confluent/common-config/5.3.4
    https://mvnrepository.com/artifact/io.confluent/common-utils/5.3.4
    
  • 未完待续
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
要在Docker安装Hudi,可以按照以下步骤进行操作: 1. 首先,确保您已经安装DockerDocker Compose。您可以从Docker官方网站上下载并安装它们。 2. 创建一个新的目录来存储HudiDocker配置文件和示例代码。例如,可以创建一个名为"hudi-docker"的目录并进入其中: ``` mkdir hudi-docker cd hudi-docker ``` 3. 在"hudi-docker"目录中创建一个名为"docker-compose.yml"的文件,并使用文本编辑器打开它: ``` touch docker-compose.yml nano docker-compose.yml ``` 4. 在打开的文件中,粘贴以下内容作为Docker Compose配置: ```yaml version: '3' services: hudi: image: apache/hudi ports: - 8888:8888 volumes: - ./data:/root/data command: "sh -c 'sleep 10 && jupyter notebook --no-browser --ip=0.0.0.0 --allow-root'" ``` 这个配置将使用Apache Hudi的官方Docker镜像,并将端口8888映射到主机的8888端口。它还将创建一个名为"data"的卷,用于在容器内和主机之间共享数据。 5. 保存并关闭文件。 6. 在"hudi-docker"目录中使用以下命令启动Docker容器: ``` docker-compose up ``` 这将下载HudiDocker镜像并启动一个名为"hudi"的容器。 7. 当容器启动后,您可以通过访问http://localhost:8888来访问Jupyter Notebook。可以在其中运行Hudi的示例代码和教程。 请注意,这只是一个简单的示例,用于在Docker中快速启动Hudi。根据您的实际需求,可能需要进行更多的配置和调整。您可以根据Hudi的官方文档进一步了解如何在Docker使用Hudi,并根据需要进行自定义配置。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CodePhage

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值