hudi系列-timeline service

Timeline Service是Hudi的一个组件,提供文件系统视图接口,基于Javalin+Jetty的web服务。服务处理BaseFileHandler、FileSliceHandler、TimelineHandler和MarkerHandler的请求,解决如AWS S3的性能问题。支持内置(默认,每个作业独享)和独立部署两种方式,减少写操作的文件系统开销。
摘要由CSDN通过智能技术生成

Timeline Service(时间线服务)是hudi的一个组件,用于暴露文件系统视图接口给客户端,是一个基于Javalin+Jetty实现的web服务。当客户端使用远程文件系统视图(RemoteHoodieTableFileSystemView)时,就是访问时间线服务http接口

在这里插入图片描述

默认情况下,如果开启了时间线服务,则它运行在JobManager(如果是spark,则在driver中),所有写任务都会向它发出请求。

功能

时间线服务接收到的请示会分派给对应的Handler进行处理

  • BaseFileHandler:获取base文件信息
  • FileSliceHandler:获取文件分片信息
  • TimelineHandler:获取timeline信息
  • MarkerHandler:管理marker文件,创建、删除、查询

前三者直接代理了文件系统视图提供的接口,第四个是实现了marker机制,支持批量创建marker文件,解决了AWS S3下性能瓶颈问题。

部署方式

时间线服务支持两种部署方式,内置方式以及独立部署方式

  • 内置方式:默认的部署方式,即hoodie.embed.
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值