数据治理工具

Data Governance Tools - Evaluation Criteria, Big Data Governance,

内容:

       前言

       第一部分:导论:

       1:数据治量简介

              定义

案例分析

数据治理的支柱

摘要

       2:企业数据管理参考架构

EDM类别

大数据

数据治理工具

摘要

第二部分:数据管理工具的数据

3:商业词汇表

       Excel,CSV或XML格式的批量加载业务术语

       创建业务术语类别

       促进社会协作

       自动超链接嵌入式商业条款

       将自定义属性添加到业务术语和其他数据工件

       将自定义关系添加到业务术语和其他数据工件

       将自定义角色添加到业务术语和其他数据工件

       将业务术语和列名称链接到关联的参考数据

       将业务术语链接到技术元数据

       支持创建自定义资产类型

       标记关键数据元素

       提供OOTB和自定义工作流来管理业务条款和其他数据工件

       查看业务术语和其他数据工件的更改历史记录

       允许业务用户直接从报告工具链接到词汇表

       搜索商业条款

       将业务术语与关联的非结构化数据集成

       摘要

4:元数据管理

       从数据建模工具中提取逻辑模型

       从数据建模工具中提取物理模型

       从关系数据库中提取元数据

       从数据仓库设备中提取元数据

       集成传统数据源中的元数据

       从ETL工具中提取元数据

       从报告工具中提取元数据

       在元数据工具中反映自定义代码

       从分析工具中提取元数据

              将业务术语与列名相关联

              从数据质量工具中提取元数据

              从大数据源中提取元数据

              提供有关数据沿袭的详细视图

              自定义数据沿袭报告

              管理元数据存储库中的权限

              支持在元数据存储库中搜索资产

              摘要

5:数据分析

       进行柱分析

       发现列的值分布

       发现列的模式分布

       发现列的长度频率

       发现隐藏的敏感数据

       发现列中具有相似声音的值

       同意数据治理计划的数据质量维度

       制定与数据质量维度相关的业务规则

       与数据质量完整性维度相关的配置文件数据

       与数据质量一致性维度相关的配置文件数据

       与数据质量一致性维度相关的概况数据

       与数据质量同步维度相关的配置文件数据

       与数据质量唯一性维度相关的配置文件数据

       与数据质量的及时性维度相关的概况数据

       发现跨列的数据重叠

       发现列之间的隐藏关系

       发现依赖关系

       发现数据转换

       创建可以分析的虚拟联接或逻辑数据对象

       摘要

6:数据质量管理

       将数据转换为标准格式

       提高地址数据的质量

       匹配并合并重复记录

       创建数据质量记分卡

       选择数据域或实体

       定义数据质量的可接受阈值

       选择要为特定数据域或实体测量的数据质量维度

       选择每个数据质量维度的权重

       选择每个数据质量维度的业务规则

       为给定数据质量维度中的每个业务规则分配权重

       将业务规则绑定到相关列

       查看数据质量记分卡

       突出显示与较差数据质量相关的财务影响

       进行时间序列分析

       管理数据质量例外

       摘要

7:主数据管理

定义MDM Hub消耗的业务术语

管理实体关系管理

主数据丰富规则

管理主数据验证规则

管理记录匹配规则

管理记录合并规则

查看杰出数据管理任务列表

管理重复项

查看数据管理仪表板

管理层次结构

提高主数据质量

将社交媒体与MDM集成

管理主数据工作流程

比较主数据的快照

提供主数据更改历史记录

将MDM任务卸载到Hadoop以加快处理速度

摘要

8:参考数据管理

       建立代码表清单

同意每个代码表的主值列表

在主值和相关CodeTable之间构建简单映射

在代码值之间构建复杂映射

管理代码值的层次结构

构建和比较参考数据的快照

可视化参考数据快照之间的跨时间交叉验证

摘要

9:信息政策管理

管理业务术语表中的信息策略,标准和流程

管理业务规则

利用数据治理工具监控和报告合规性

管理数据问题

摘要

 

第三部分:企业数据管理与数据工具之间的整合

       10:数据建模:将逻辑和物理数据模型与元数据存储库集成

              在元数据存储库中公开本体

              使用数据发现工具对跨数据域的统一模式进行原型设计

              建立数据模型以支持主数据管理摘要

       11:数据集成:使用数据集成以集成方式部署数据质量作业

              在MDM或参考数据中心与源系统之间移动数据

              利用数据集成工具使用的参考数据

              将数据集成工具集成到元数据存储库中

              通过利用元数据存储库自动生成数据集成作业

              摘要

12:分析和报告

将数据分析结果导出到报告工具以进行进一步的可视化分析

将数据工件导出到报表工具以实现数据治理指标的可视化

将分析和报告工具与语义上下文的业务术语表集成

摘要

13:业务流程管理

数据治理工作流应该利用BPM功能

主数据工作流应该利用BPM功能

数据治理工具应映射到BPM工具

摘要

14:数据安全和隐私

确定隐私义务

使用数据发现工具发现敏感数据

标记元数据存储库中的敏感数据

在生产环境中屏蔽敏感数据

掩盖非生产环境中的敏感数据

监视特权用户的数据库访问

文档信息策略由数据屏蔽和数据库监视工具实现

使用数据屏蔽工具可以执行的数据发现工具创建完整的业务对象

摘要

15:信息生命周期管理

ILM工具实现的业务术语表中的文档信息策略

发现可以通过ILM工具高效执行的完整业务对象

摘要

第四部分:大数据治理工具

16:Hadoop和NoSQL

在Hadoop中执行数据清单

在Hadoop中分配数据的所有权

在Hadoop中为Analytics提供语义层

查看Hadoop内外数据的沿袭

管理Hadoop的参考数据

在Hadoop中本地配置数据

在Hadoop中本地发现数据

在Hadoop中本地执行数据质量规则

将Hadoop与主数据管理集成

Hadoop的端口数据治理工具可提高性能

管理NoSQL数据库中的数据

在Hadoop中屏蔽敏感数据

摘要

17:流计算

使用数据分析工具来理解输入数据的样本集

管理流计算应用程序使用的参考数据

管理流计算应用程序使用的业务术语

摘要

 

18:文本分析

大数据治理降低充血性心力衰竭患者的再入院率

利用非结构化数据提高稀疏性质量

  填充结构化数据

提取结构化数据中不可用的其他相关预测变量

为关键业务术语定义一致的定义

确保设施中患者主数据的一致性

遵守隐私要求

管理参考数据

摘要

第五部分 - 评估标准和供应商景观

       19:数据治理平台的评估标准

              总拥有成本

数据管理

审批工作流程

数据工件的层次结构

数据治理指标

云端

摘要

20:ASG

ASG- metaGlossary

ASG-Rochade

ASG-becubic

21:Collibra

商业词汇表

参考数据管理

数据管理

工作流程

元数据

             数据分析

 

       22:全球ID

数据分析

数据质量

元数据

23:IBM

元数据

信息集成

             数据质量

主数据管理

数据生命周期管理

隐私和安全

24:Informatica

数据分析和数据质量

元数据和业务术语表

主数据管理

信息生命周期管理

安全和隐私云

25:Orchestra Networks

工作流数据建模

主数据管理

参考数据管理

商业词汇表

26:SAP

内存数据库数据

质量和元数据管理

主数据管理

内容管理

信息生命周期管理

企业建模

数据集成

 

27:Talend

扩展生态系统

大数据

数据集成

数据质量

主数据管理

企业服务总线(ESB)

业务流程管理(BPM)

28: 着名的供应商

Adaptive

BackOffice Associates

Data Advantage Group

Diaku

Embarcadero Technologies

Global Data Excellence

Harte-Hanks Trillium

Oracle

SAS

附录A:缩略语列表

附录B:术语表

附录C:使用工具自动执行的潜在数据治理任务

商业词汇表

元数据管理

数据分析

数据质量管理

主数据管理

参考数据管理

信息政策管理

数据建模数据集成

分析和报告

业务流程管理

数据安全和隐私

信息生命周期管理

Hadoop和NoSQL

流计算

文本分析

索引

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 数据治理是指企业对数据进行全面规划、管理和监控的过程。在数据治理中,Java作为一种高效、可靠的编程语言,可以提供各种工具来帮助实现数据治理的目标。 首先,Java提供了强大的数据操作和处理库,如Apache Hadoop、Apache Spark等。这些工具可以帮助企业高效地处理大规模数据,进行数据清洗、集成和转换操作,确保数据的准确性和一致性。 其次,Java还提供了丰富的数据库操作工具,如Hibernate、JDBC等。这些工具可以帮助企业对数据进行持久化存储和访问,提供数据的可靠性和安全性。 此外,Java还提供了多线程编程的支持,可以实现并发处理和并行计算,加快数据处理的速度。 另外,Java还提供了各种数据可视化和报表生成的工具,如JavaFX、iText等。企业可以使用这些工具将数据以可视化的形式展示,帮助决策者更好地理解和分析数据,做出有意义的决策。 最后,Java还具有开放源代码、跨平台等特性,可以与其他数据治理工具和平台进行无缝集成,形成完整的数据治理解决方案。 综上所述,Java作为一种强大的编程语言,提供了丰富的工具和库,可以帮助企业实现数据治理的各个环节,包括数据处理、存储、可视化和集成等方面。 ### 回答2: 数据治理是指对组织内部的数据资源进行全面管理和控制的一种管理方法。它主要通过定义数据采集、存储、管理和使用的规范、标准和流程,确保数据的质量、完整性和可靠性,并实现数据的合规性和安全性。 在数据治理过程中,为了提高数据管理的效率和精度,Java语言成为了一种常用的工具。Java是一种面向对象的编程语言,具有跨平台性和强大的工具生态系统,可以提供复杂的数据处理和分析功能。 首先,Java提供了许多用于数据存储和管理的框架和库,如Hibernate、MyBatis等。这些工具可以帮助开发人员快速建立数据库连接、执行数据操作和管理数据结构,提高数据管理的效率和准确性。 其次,Java语言具有丰富的数据处理和分析的功能库,如Apache Spark、Apache Hadoop等。这些工具可以帮助用户进行大数据的处理和分析,支持对海量数据进行清洗、过滤、聚合等操作,从而提取有价值的数据,并为数据治理决策提供支持。 此外,Java语言还支持各种数据处理的算法和模型,如机器学习和人工智能算法。利用Java的强大编程能力和开发工具,可以对数据进行建模、训练和预测,从而进一步提高数据治理的质量和效果。 总之,Java作为一种强大的编程语言,具有丰富的工具和库支持,可以提供全面的数据治理能力。它能够帮助组织实现对数据的高效管理和控制,提高数据质量和价值,为数据治理决策提供有力支持。 ### 回答3: 数据治理是指对企业的数据进行全面管理、使用和维护的一系列活动和措施。数据治理的目的是确保数据的质量、准确性和完整性,并使其能够有效地支持企业的决策和业务需求。 在数据治理过程中,使用合适的工具是至关重要的。Java作为一种广泛应用于企业级开发的编程语言,可以提供一些强大的数据治理工具和框架。 首先,Java提供了许多开源的数据治理工具,如Apache Atlas、Apache Ranger和Apache Sentry。这些工具能够帮助企业建立元数据管理系统、数据访问控制和安全策略,从而实现对数据的全面管理和保护。 其次,Java还提供了丰富的数据处理和分析工具,如Apache Hadoop、Apache Spark和Elasticsearch等。这些工具数据治理中起到重要作用,可以用于数据清洗、转换、聚合和分析,帮助企业发现数据中的潜在问题和价值。 此外,Java的丰富的开发框架也为数据治理提供了支持。Spring框架和Hibernate ORM框架等可以帮助开发人员构建稳健的数据管理和访问层,简化数据治理流程。 最后,Java还有许多用于构建自定义数据治理工具工具包和库。开发人员可以使用Java编写自定义的数据质量检查工具、数据血缘追踪工具等,以满足特定的数据治理需求。 总而言之,Java作为一种强大的编程语言,提供了丰富的数据治理工具和框架,可以帮助企业进行全面的数据管理和治理。这些工具不仅能够提高数据的质量和可信度,还能够发现数据中的潜在问题和价值,为企业的决策和业务发展提供有力支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值