第二章-AllData数据治理平台-企业级数据治理功能教程

一、AllData数字化方案数据治理平台

数据平台的数据治理:数据治理是一个大而全的治理体系。
需要数据质量管理、元数据管理、主数据管理、模型管理管理、数据价值管理、
数据共享管理和数据安全管理等等模块是一个活的有机体。

1、数据质量: 依托Griffin平台,为您提供全链路的数据质量方案,
包括数据探查、对比、质量监控、SQL扫描和智能报警等功能:

开源方案: Apache Griffin + ES + SparkSql

2、元数据: 描述数据的数据,对数据及信息资源的描述性信息,
例如字段元数据描述字段的类型、长度、默认值。 
发布:指将某一元数据发布为数据资产的动作。
数据资产是指可以对外提供服务并且产生价值的数据。
表/字段血缘:即表/字段的来龙去脉,
主要包含表/字段的来源、加工方式、映射关系及数据出口。
血缘是元数据的一部分,有利于数据变更影响分析以及数据问题排查。

开源方案: Apache Atlas + ES + Hbase + JanusGraph + Hive + Kafka

3、数据标准: 参考阿里的DataWorks,
数据标准是用于描述公司层面需共同遵守的数据含义和业务规则,
它描述了公司层面对某个数据的共同理解,
这些理解一旦确定下来,就应作为企业层面的标准在企业内被共同遵守。
数据标准,也称数据元,由一组属性规定其定义、标识、表示和允许值的数据单元,
是不可再分的最小数据单元。您可以将数据标准关联到各个业务上的数据库中。
其中,标识符、数据类型、表示格式、值域是数据交换的基础,
它们用于描述表的字段元信息,规范字段所存储的数据信息。

暂无事实性标准的开源方案:Mysql + SpringBoot

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论
目前比较知名的开源实时数据中台框架是Apache Superset,它是一个面向数据分析和可视化的平台,可以用于实时数据处理和可视化展示。它是用Python开发的,具有高度的可扩展性和灵活性。 Apache Superset的主要特点包括: 1. 数据可视化:Apache Superset提供了多种数据可视化图表和报表,可以帮助用户直观地了解数据的趋势和变化。它支持多种数据源的数据可视化,包括关系型数据库、NoSQL数据库、Hadoop、Spark等。 2. 实时数据处理:Apache Superset支持实时数据处理和可视化展示,可以帮助用户及时了解数据的变化和趋势。它支持多种实时数据处理技术,例如Kafka、Storm、Flink等。 3. 多种数据源支持:Apache Superset支持多种数据源的数据处理和可视化,包括关系型数据库、NoSQL数据库、文件系统、消息队列等。同时,它还支持多种数据格式和协议的解析和管理。 4. 多租户支持:Apache Superset支持多租户架构,可以为不同的用户和组织提供独立的数据处理和可视化环境。这使得用户可以更好地管理和保护数据资产。 5. 开放式API和插件架构:Apache Superset提供了开放式的API和插件架构,可以方便地与其他数据治理工具集成,例如Apache Atlas、Apache Ranger等。 总的来说,Apache Superset是一款功能强大的开源实时数据中台框架,可以帮助用户更好地管理和利用数据资产,提高数据的可发现性、可用性和可信度。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AllData公司负责人

AllData全新会员商业版

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值