
元数据
文章平均质量分 89
deepdata_cn
极深数据,深耕数据行业。
展开
-
开源统一元数据平台(OpenMetadata)
OpenMetadata是一个开源的统一元数据平台,在数据管理领域具有重要作用。OpenMetadata源自曾参与Uber元数据基础设施建设团队的经验积累。在打造Uber的Databook解决数据编目问题后,团队发现现有数据编目系统缺乏统一的元数据模型,OpenMetadata项目应运而生,旨在填补这一空白,并增加元数据的灵活性和可扩展性。2022-2023年:项目处于活跃开发期,在短短1.5年时间里发布超过40个版本。原创 2025-01-29 07:30:00 · 2172 阅读 · 0 评论 -
元数据管理框架(Egeria)
Egeria是一个开源项目,由Linux基金会托管。允许组织在其组织内共享和管理数据,依赖OpenLineage标准进行数据血统管理,定义了企业为管理数字资源所需的800多种元数据的标准模式,并通过开放API、框架、连接器和交换协议等实现工具和元数据存储库之间的元数据共享和交换。适合大型企业,尤其是需要高度自动化、集成的平台间信息交换解决方案的团队。它提供了一种标准化的方式来管理和共享企业内的元数据,这些元数据涉及到数据资产、IT系统、业务流程等众多方面。原创 2025-01-23 07:30:00 · 1188 阅读 · 0 评论 -
元数据管理工具(LinkedIn WhereHows)
WhereHows提供对结构化和非结构化元数据的全面管理,具有强大的数据目录和搜索功能,便于数据发现和使用,由LinkedIn开源,拥有强大的社区支持和文档资源。适合需要全面元数据管理和数据目录功能的公司,尤其是大型互联网企业或拥有海量数据的企业。提供了直观的Web界面,用户可以通过浏览器访问该平台,进行数据发现、血缘查看、注释、讨论等操作。界面简洁易用,方便非技术人员也能快速上手。同时提供了后台API,供开发者进行自动化集成和扩展。原创 2025-01-08 07:30:00 · 838 阅读 · 0 评论 -
数据目录和元数据管理(Metacat)
Metacat是一个开源的数据目录和元数据管理工具,它能够有效地处理和管理跨多种数据源和数据存储系统的元数据。其设计目的是帮助企业构建一个统一的数据目录,使得数据使用者能够更容易地发现、理解和使用数据。Metacat能与多种数据库、数据仓库和数据湖集成,支持复杂的数据生态系统。提供丰富的API,便于开发者进行二次开发和系统集成,支持多种元数据存储方式。原创 2025-01-07 08:00:00 · 868 阅读 · 0 评论 -
元数据管理平台(DataHub)
DataHub:是一个用于数据发现、元数据管理和数据治理的开源平台。它提供了一个集中式的元数据存储库,支持多种数据源和数据格式。DataHub 具有强大的搜索和浏览功能,使用户能够轻松发现和理解数据资产。此外,它还提供了数据 lineage(数据血缘)跟踪、数据质量监控和数据治理工作流等功能,帮助企业更好地管理和利用其数据资产。原创 2024-09-09 07:30:00 · 1206 阅读 · 0 评论 -
数据治理工具(Apache Atlas)
Apache Atlas为具有数据密集型平台的公司提供基本的元数据管理和数据治理功能,主要为在 Hadoop 集群中使用而设计,但也可与 Hadoop 生态系统之外的工具和进程交换元数据以实现集成。它具有灵活的类型系统来定义和管理元数据对象的模型,能自动对数据资产和数据沿袭信息进行编目,并与 Apache Ranger 数据安全框架集成实现访问控制和数据屏蔽等功能。Apache Atlas 是一个开源的企业级数据治理和元数据管理工具。原创 2024-09-08 07:45:00 · 1615 阅读 · 0 评论 -
地理信息元数据标准
地理信息元数据标准的发展是一个不断演进和完善的过程。国际上,早期的相关标准如 ISO 19115:2003 等,对地理信息元数据进行了详细描述,包括数字地理数据标识、覆盖范围、质量、空间和时间模式、空间参照系和分发等信息。后来,标准不断更新和改进,以适应技术发展和实际应用的需求。例如,ISO 19115-1:2014《地理信息 元数据 第 1 部分:基础》发布。原创 2024-08-23 07:45:00 · 1453 阅读 · 0 评论 -
元数据(Metadata)
元数据是关于数据的数据。它主要用于描述数据的特征、内容、来源、关系等信息,以便更好地理解、管理、查找和使用数据。元数据就像是数据的 “说明书”,它可以告诉我们数据的来源、创建时间、格式、内容含义、质量等重要信息。原创 2024-08-22 07:45:00 · 1093 阅读 · 0 评论 -
XML(可扩展标记语言)元数据标准
XML(可扩展标记语言)元数据标准是一种利用 XML 技术来描述和组织数据特征的规范体系。原创 2024-08-23 07:30:00 · 996 阅读 · 0 评论 -
元数据在数据治理中的作用
元数据在数据治理中起着基石作用,它是连接技术、业务与管理层面的桥梁,支撑着数据驱动决策的每一个环节。通过对元数据的有效管理和利用,组织能够最大化数据的价值,同时降低数据管理的复杂性和风险。因此,重视并投资于元数据管理,是任何致力于成为数据驱动型组织不可或缺的一环。此外,元数据管理还涉及到创建指标解释体系、提高数据溯源能力以及建立数据质量稽核体系。最后,元数据治理是确保元数据准确、格式一致且安全存储的系统方法。它的目标是改善数据质量、确保数据隐私并简化元数据管理。原创 2024-07-27 07:30:00 · 1618 阅读 · 0 评论 -
数据血缘(Data Lineage)
数据血缘作为数据治理的核心组件,其价值和影响力正在随着技术的演进和社会需求的提升而不断放大。未来,数据血缘将成为推动数字经济健康发展、保障数据安全与合规、释放数据潜在价值的强有力支撑。原创 2024-04-29 17:45:09 · 1430 阅读 · 0 评论 -
一切业务数据化,一切数据业务化
阿里现在讲的一句话:“一切业务数据化,一切数据业务化”。前半句的场景其实一直都在发生,只不过大家称之为信息化。大多数传统业务都在线下展开,完全的业务数据化是十分困难的。但作为互联网企业,先天的优势就是业务数据化。后边这句话可以理解为,让阿里各项业务所产生、积累的大数据来丰富阿里的生态,同时让生态蕴含的数据产生新的价值,再反哺生态,这是一个相辅相成的循环逻辑。 “业务生产数据、数据反哺业务” ...原创 2018-09-08 15:07:11 · 21692 阅读 · 0 评论