大数据治理
文章平均质量分 93
一 铭
公众号:大数据架构师修行之路
展开
-
如何选择: 数据仓库(Data Warehouse),数据湖(Data Lake),数据湖仓(Data Lakehouse)
databricks公司推出delta lake后,又推出了Data Lakehouse。该产品结合了数据仓库和数据湖的优势。本文介绍了数据仓库,数据库,数据湖仓的特点和使用场景,避免在使用时产生混淆。原创 2023-03-12 10:17:54 · 1647 阅读 · 0 评论 -
大数据治理开源组件Griffin介绍
概述大数据发展到今天,对数据质量的要求越来越高,如何保证数据的质量,如何对数据的一致性进行检测?本文介绍开源的数据治理组件griffin的功能和组成。griffin是国人(ebay工程师)编写的一款数据治理开源软件。Griffin介绍Apache Griffin(以下简称Griffin)是一个开源的大数据数据质量解决方案,它支持批处理和流模式两种数据质量检测方式,可以从不同维度(比如离线任...原创 2019-04-06 18:13:53 · 10123 阅读 · 0 评论