一款简洁的数据流引擎,让数据自由流转

本文介绍了Dagster,一个用于构建数据类应用的数据流引擎,它提供了优雅的编程模型、增量可扩展性和直观的UI。Dagster支持与多种工具如Spark、Python、Jupyter等集成,并具有内置的测试能力和直观的本地开发界面,适合数据工程师、机器学习工程师和分析师使用。了解更多信息,请访问其开源项目地址。
摘要由CSDN通过智能技术生成

watermark,image_bG9nby9jc2RuXzEucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLGhfNjI=,g_se,x_0,y_0,t_100

大家好,我是你们的章鱼猫。

今天推荐一个简洁优雅的数据流引擎工具 Dagster,它的目标是帮助大家构建与时俱进的数据类应用,通过该工具能够让数据科学家、数据工程师以及其他人员在同一个数据管道上进行合作协同。


watermark,image_bG9nby9jc2RuXzEucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLGhfODE=,g_se,x_0,y_0,t_100


Dagster 拥有优雅的编程模型、增量可扩展能力以及方便易用的 UI,其创建团队中一名成员参与过 GraphQL 的开发。

  • 优雅的编程模型

Dagster 定义了一系列的抽象类型,帮助我们构建自描述、可测试和可靠的数据类应用。重要的是,该工具将可测试的能力定义为工具的原生能力。


watermark,image_bG9nby9jc2RuXzEucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLGhfNTY=,g_se,x_0,y_0,t_100


  • 增量可扩展能力

Dagster 能够方便的集成现有的工具和基础设施,比如 Spark、Python、Jupyter notebook、SQL 等。同时也能与其他的流程引擎进行集成,比如 Airflow。

watermark,image_bG9nby9jc2RuXzEucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLGhfNTY=,g_se,x_0,y_0,t_100
  • 漂亮易用的 UI

Dagster 定义了一套简洁易用的本地开发界面,能够方便数据工程师、机器学习工程师、数据分析师使用。

watermark,image_bG9nby9jc2RuXzEucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLGhfNTY=,g_se,x_0,y_0,t_100

以下是一个简单的数据流示例。其中 pipeline 对应一个数据流水线,而其中的 solid 对应一直执行单元,按照一定的规则输入和输出,无其他的副作用。通过定义数据的流向,也就是将不同的 solid 的输入和输出进行串联,最终可以构建一个数据的处理流程。下图的代码能够直接转换成对应的数据流图,方便分析和可视化。


watermark,image_bG9nby9jc2RuXzEucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLGhfOTQ=,g_se,x_0,y_0,t_100


更多项目详情请查看如下链接。

开源项目地址:https://github.com/dagster-io/dagster

最后,照旧安利一波我们的公众号:「GitHub 精选」,目前每天都会推荐一篇优质的开源项目文章,主要分享比较实用或有趣的开发工具与开源项目。我们的目标是:挖掘开源的价值。这个公众号超级值得大家关注。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值