01-Datahub是什么?

Datahub,原名WhereHows,是LinkedIn开源的元数据管理平台,专为现代数据栈设计。该平台支持Tableau、PowerBI、Superset等数据可视化工具以及Airflow、Spark等大数据组件的元数据管理。具备搜索、数据血缘、数据分析、标签和术语表等功能,并可集成数据质量框架。Datahub的优点在于其强大的数据发现和搜索,以及对多种数据源的支持,但初学者可能需要面对复杂的界面和配置。对于学习元数据管理,Datahub是一个极好的资源。
摘要由CSDN通过智能技术生成

Datahub是LinkedIn开源的基于现代数据栈的元数据管理平台,原来叫做WhereHows 。经过一段时间的发展datahub于2020年2月在Github开源。

官网地址为:A Metadata Platform for the Modern Data Stack | DataHub

源码地址为:GitHub - datahub-project/datahub: The Metadata Platform for the Modern Data Stack

目前标星8.8K,最新稳定版本0.12.0。

开发语言为Java和Python。

官网

页面

Datahub支持的功能:

Datahub是现代数据栈的元数据管理平台,支持Tableai、PowerBI、Superset等数据可视化工具。也支持Airflow、Spark、ES、Kafka、Hive、Mysql、Oracle等大数据组件的元数据的获取。

有搜索,数据血缘,数据分析,标签,术语表等功能,也可以集成数据质量框架,如GreatExceptions。

Datahub的优缺点:

优势:

强大的数据发现和搜索功能,方便用户快速定位所需数据。

提供数据质量元数据,帮助用户理解和信任数据。

支持多种数据源,包括传统的关系数据库和现代的数据湖。

社区活跃,不断有新功能和改进加入。

劣势: 初学者可能会觉得界面和配置相对复杂。

在某些情况下,集成新的数据源可能需要额外的开发工作。

总之Datahub是目前最优秀的元数据管理项目,如果能掌握Datahub对于学习元数据管理帮助巨大。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大数据流动

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值