自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 Datahub组成

摄入框架是一个模块化、可扩展的 Python 库,用于从外部源系统(例如 Snowflake,Looker,MySQL,Kafka),将其转换为DataHub的元数据模型,并通过以下方法将其写入DataHub。元数据模型是定义构成元数据图的实体和方面的形状以及它们之间的关系的模式。实体表示特定类别的元数据 数据集、仪表板、数据管道等资产。GraphQL API 提供了一个强类型、面向实体的 API,可以与包含元数据的实体进行交互 图形简单,包括用于添加和删除标签,所有者,元数据实体链接等的API!

2023-03-27 10:14:28 268

原创 Datahub体系结构概述

DataHub的元数据基础设施是面向流的,允许在几秒钟内在平台内传达和反映元数据的变化。您还可以订阅 DataHub 元数据中发生的更改,从而允许您构建实时元数据驱动的系统。例如,您可以构建一个访问控制系统,该系统可以观察以前全局可读的数据集,添加一个包含 PII 的新架构字段,并锁定该数据集以进行访问控制审查。但是,它还支持可以由不同团队拥有和运营的联合元数据服务 - 事实上,这就是LinkedIn内部运行DataHub的方式。DataHub的架构有三个主要亮点。元数据建模的架构优先方法。

2023-03-24 14:53:58 509

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除