Flink & Hudi 学习

本文介绍了Apache Flink,一个用于实时和批处理的数据处理框架,以及Hudi,一个针对Hadoop的实时分析数据存储系统。Flink提供事件驱动型应用和数据分析应用等功能,而Hudi支持在HDFS上的读优化和近实时表,提供更新和删除的解决方案。文章还提到了基于Flink的数仓实时化改造实践和关键术语,如维表、事实表和数据仓库分层。
摘要由CSDN通过智能技术生成

Flink & Hudi

  • Flink官网(中文): https://flink.apache.org/zh/flink-architecture.html
  • Hudi官网: https://hudi.apache.org/cn/

认识 Flink

Apache Flink 是一个框架 & 分布式处理引擎,用于在无边界数据流有边界数据流上进行有状态的计算。

  • 能在所有常见集群环境运行
  • 能以内存速度任意规模进行计算

应用:

  • 事件驱动型应用: 是一类具有状态的应用,它从一个或多个事件流提取数据,并根据到来的事件触发计算状态更新或其他外部动作。
    • 从传统的事务型应用进行而来(即计算与存储分离的)
    • 定期向远程持久化写入&异步检查(periodically write & asynchronous checkpoints)
  • 数据分析应用
  • 数据管道应用

使用: https://flink.apache.org/zh/flink-applications.html#layered-apis

Table API & SQL: https://nightlies.apache.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值