数据治理
文章平均质量分 67
数据治理
不死鸟.亚历山大.狼崽子
太极计算机股份有限公司系统架构师,从事ios、.net、flex、java等开发
展开
-
数据治理(6):数据指标与指标体系
数据标签偏向用于业务执行过程,数据指标偏向用于业务决策和结果评估。本文笔者讲讲对数据指标和数据指标体系的理解。转载 2024-05-29 15:41:28 · 124 阅读 · 0 评论 -
数据治理(5):数据标签与标签体系
数据标签、数据指标是根据不同应用场景对数据加工处理后得到的两种数据应用表现形式,两者容易混淆。从服务业务角度来看,数据标签偏向用于业务执行过程,数据指标偏向用于业务决策和结果评估。本文将谈谈笔者对数据标签和标签体系的理解,后续将推出文章介绍数据指标和数据指标体系,以及数据标签与数据指标的差别之处。转载 2024-01-14 15:36:38 · 522 阅读 · 0 评论 -
数据治理(4):数据管理、数据治理、数据运营
数据作为原始资源,需要通过开展数据管理、数据治理、数据运营等工作,实现增值和价值变现。很多时候容易将数据管理、数据治理、数据运营三者混淆。本文将讲讲如何理解数据治理、数据管理、数据运营的内涵以及它们的活动内容,希望对您有所启发。转载 2024-01-09 09:08:41 · 92 阅读 · 0 评论 -
数据治理(1):数据血缘与数据地图
因此,对数据工程师来说,如何管理表之间、代码之间的复杂关系,更好地理解业务系统与底层表的关系、底层表的表间关系,以及理清当前数据(字段、关键指标或数据标签)的 来源和去向,哪些下游系统在使用这些数据等,成为一件非常重要的事。比如,数据A经过ETL处理生成了数据B,那么我们就说数据A与B有着血缘关系,且数据A是数据B的上游数据,同时数据B是数据A的下游数据。数据血缘又称数据血统、数据起源、数据谱系,是指数据的全生命周期中,数据从产生、处理、加工、融合、流转到最终消亡,数据之间自然形成一种关系。原创 2023-12-30 16:15:41 · 624 阅读 · 0 评论 -
数据治理(3):结构化、非结构和半结构数据
在现实环境下,结构化数据和非结构化数据的比例为2:8;虽然结构化数据目前占比较少,但是由于结构化数据的分析起来比较便利,目前数据分析还是以结构化数据为主。数据的多种形态展现出了信息世界的丰富多样性,每种数据形态都有其独特的特点和应用场景。了解不同数据形态的定义和特征,有助于我们更好地利用数据资源,挖掘出更多的价值。在数据时代,拥抱数据的多样性,开启创新的大门,让我们与数据共舞,探索无限可能!原创 2024-01-01 13:33:02 · 600 阅读 · 0 评论 -
数据治理(2):数据治理的技术逻辑
数据治理其实是一种更偏向于组织管理和流程制度上的概念,而不是一种纯粹的工程技术上的概念,这是从我个人感受来看的,每当搜索数据治理相关的一些资讯的时候,大部分是一些形式上的、或者管理上的、制度建设上的文章信息,夹杂着少部分的如Apache Atlas等具体工具使用方法的文章信息。但对于数据治理的需求提出者来说,那部分关于Apache Atlas的具体使用信息他们并不感兴趣,“数据治理”对他们来说一般只是个概念性的目标,因为“数据治理”的直接受益者和成果使用方其实一般并不是需求提出方,而是信息技术部门。转载 2024-01-01 12:47:42 · 94 阅读 · 0 评论