Falcon（一）——数据集管理和数据处理平台

最新推荐文章于 2024-04-06 13:59:29 发布

NobiGo

最新推荐文章于 2024-04-06 13:59:29 发布

阅读量6.2k

点赞数 6

分类专栏： Falcon入门文章标签：管理数据 Falcon

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/it_dx/article/details/57564628

版权

Falcon入门专栏收录该内容

4 篇文章 3 订阅

订阅专栏

目的：

使终端用户在面向Hadoop集群进行数据集处理和数据集管理更加容易。

原因

在Hadoop环境中，在各种数据集和处理关系之间建立关系
在集群中进行数据集管理例如数据集声明周期、数据集复制等
抓取数据集或者处理过程的血统信息。
允许本地数据和其他任何地方的集群进行数据整合。
与metastore和catalog进行整合，例如：Hive和Hcatalog
Easy to onboard new workflows/pipelines, with support for late data handling, retry policies

Falcon是一个面向Hadoop的、数据处理和管理平台。它被设计用于数据移动、数据管道协调、生命周期管理和数据备份等场景。Falcon本质上是通过数据处理引擎将数据集和处理过程的配置信息转化为重复的业务处理流程。

在Apache Falcon中，集群接口连接、数据集、处理规则均是声明式的。这种声明式配置显式定义了实体之间的依赖关系，这也是该平台的一个特点，它本身只维护依赖关系，而并不做任何繁重的工作。所有的功能和工作流状态管理需求都委托给工作流调度程序来完成。

Apache Falcon解决了大数据领域中一个非常重要和关键的问题。升级为顶级项目是该项目的一个重大进展。Apache Falcon具有完善的功能实现，可以使应用程序开发和管理人员在管理数据时实现自动化。

关注

6
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
2
评论
Falcon（一）——数据集管理和数据处理平台

目的：使终端用户在面向Hadoop集群进行数据集处理和数据集管理更加容易。原因在Hadoop环境中，在各种数据集和处理关系之间建立关系在集群中进行数据集管理例如数据集声明周期、数据集复制等抓取数据集或者处理过程的血统信息。允许本地数据和其他任何地方的集群进行数据整合。与metastore和catalog进行整合，例如：Hive和HcatalogEasy to onboard new wo
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

NobiGo 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。