来自Gartner数据和分析峰会的5个收获

  您应该了解活动元数据以及如何使用它来构建前瞻性数据堆栈

  Prukalpa.·5分钟阅读

  

  > Photo by Maxim Hopman on Unsplash

  我很高兴参加今年6月初举行的Gartner Data&Analytics峰会,我参加了超过50个会话,专注于策略和讨论,以帮助数据和分析领导者满足今天和未来的需求。

  在这些会话中,一个重复概念是活动元数据:似乎能够实现2022的最高趋势的隐藏力:增强数据目录,自动数据,数据结构和数据网格,数据和分析治理以及数据工具的消费化。

  在本文中,我将描述主动元数据的基础知识,并列出5个外来的3个外接链,该直接将帮助您利用活动元数据来构建前瞻性数据堆栈。

  1.增强数据目录现在是企业必须的

  我们希望将现代数据栈视为一种神奇的解决方案,但即使是现代数据团队,具有现代基础架构的现代数据团队通常会努力查找和记录其数据。

  今天的数据团队正面临这些目录挑战:

  他们几乎没有深入了解数据的生活在哪里。他们经常花更多的时间寻找数据而不是实际分析它。他们发现难以在商业用户之间的数据资产中分享上下文。

  今天的传统数据目录只是不解决这些问题。

  但是,机器学习增强数据目录主动爬网并解释元数据以解决这些问题。它们可以实现实时数据发现,自动编目数据资产,以及围绕数据的更好背景,所有这些都显着降低了从问题到解所需的时间。

  不确定机器学习数据目录(MLDC)是什么?在这里了解更多信息。

  

  > Image by Atlan.

  2.活动元数据是自主数据端的关键

  “到2023年,利用主动元数据,机器学习和数据面料的组织来动态连接和自动化数据管理进程将减少他们的数据传递时间,并对自考价值影响30%,Gartner期望。”

  Cio Dive Roberto Torres

  传统数据目录只是被动地包含并组织技术元数据 - 即组织数据的基本信息。然而,活动元数据,普遍发现,丰富,存货和使用所有这些元数据,采用传统的“被动”技术,并使其真正采取行动导向。

  这有助于组织最大限度地提高数据的价值,并在目录删除到用户活动,跨数据资产的连接等内找到更深入的洞察力。因此,激活元数据是设置用于组织中不同数据用户的Dataops框架的第一个也是最重要的步骤。

  3.激活元数据对于启用数据结构至关重要

  数据结构是一个统一的环境 - 由运行在该体系结构之上的架构和数据服务组成 - 帮助组织管理其数据。将其视为跨越所有不同数据源和终点的“结构”。

  “数据结构利用现有,可发现和推论的元数据资产的连续分析,以支持所有环境中的集成和可重复使用数据的设计,部署和利用,包括混合和多云平台。”

  亚武普塔,Gartner

  数据结构不是一种现成的工具或技术。相反,它由各种工具,资源和流程组成。数据结构是一种新兴的设计框架,可识别和连接来自不同应用程序的数据,以发现可用数据点之间的唯一业务相关的关系。

  今天没有独立的工具或解决方案被配备为全方位的数据结构架构。相反,起点是投资元数据管理解决方案。这些需要通过知识图来支持元数据摄取,共享,策策,激活和表示。获取元数据右是为数据系统设置可组合数据结构的第一步。

  4.元数据管理工具的消费化

  现代数据栈快速发展和多样化。在几秒钟内轻松扩展,但略微突出,但它可能是将治理,信任和背景带来数据的痛苦 - 这就是活动元数据本身在生态系统中不可或缺的地方。

  过去,为更多技术用户和科学家们建立了数据目录和管理工具。但这些平台越来越多地变得更加消除,或者意味着每个人都在日常工作中使用。

  现在,技术业务人员现在预计将快速访问和使用值得信赖的数据 - 而不是通过电子邮件发送工程师,而是简单的自助服务工具。

  这些用户而不是受到负担,而是为组织识别如何使用和结构数据,提供了一个新的视角。

  随着更多业务用户潜入数据,企业正在实现减少数据发现和准备时间的重要性,并提供充足的上下文,以帮助更少的技术用户生成并采取行动的洞察力。这就是为什么传统的数据管理工具开始让位于现代元数据管理工具(例如Atlan),这些工具专注于伟大的最终用户体验,而不是我们所看到的现代企业技术产品如松懈。

  这些现代工具不仅可以更能访问商业用户,而且还可以显着提高数据工程团队的生产力。这符合企业技术的更广泛的趋势,这些技术由Slack和Incion等新工具引领。

  5.数据分析和治理能力正在收敛

  要掌握和信任数据,数据不在孤岛上的必要条件。当没有人知道谁正在寻找特定数据集以及为什么时,多级层次结构和管理会使数据问题更糟糕。

  这就是为什么管理数据不仅仅是关于对数据访问的限制,而且还会有关民主化数据并确保它在正确的时间到达合适的用户。

  数据治理的最终目标是赋予更顺畅和更快的决策。

  今天,我们正在看到融合,数据治理正在成为数据分析管道的活动部分。治理而不是一个漂亮的奖金,现在是一个必须为所有需要打开的现代数据生态系统的功能,而不会损害数据安全或遵守情况。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值