第六讲主题:数仓中的数据治理

本文探讨了数据治理在数据仓库中的关键作用,包括合规性、降低成本、团队技术提升。数据治理涉及元数据合规、数据安全、质量控制、资源管理和计算优化等方面,并强调在业务中后期进行治理的重要性。文章还提到了数据治理平台的功能,如健康诊断、定期扫描和体系化建设,以及如何通过质量评分和元数据管理来确保数据的准确性和安全性。
摘要由CSDN通过智能技术生成

数据治理要做啥?
[百度搜索 踏踏实实练sql, 那个B站站主是某大厂数仓大佬,可加好友学习,他人很好]
实际上数据治理的范畴相当广泛,
按照Google对于数据治理的定义,
它包含了数据生命周期(从获取、使用到处置)
内对其进行管理的所有原则性方法。涵盖确保数据安全、私有、准确、可用和易用所执行的所有操作,包括必须采取的行动、必须遵循的流程以及在整个数据生命周期中为其提供支持的技术

本质:
1.合规, 使用效率就会提高
2.降本增效, 根本就是降低成本, 更少的钱干更多的事
3.团队人员技术提升

1.1元数据合规:
1.2数据安全合规: 不能被下游随意引用
1.3数据质量合规: 质量问题发生频发,缺少链路保障

1.4资源治理  
1.5计算治理  代码优化, 有效任务


在哪个业务发展阶段做数据治理:中后期
业务发展四大阶段:
1.探索期
2.拓展期 需求很多 数据应用 数据资产
3.发展期 数据治理 数据安全 指标口径 元数据管理
4.变革期 精细化运营, 提高治理效率--重新整顿哪些地方
把团队总包的成本 降本增效


数据治理阶段

数据治理内容:
1.数据治理平台
数据治理平台中有 
数据治理360:大盘, 健康诊断, 消耗内容 调度任务

2.合规
---数据质量
2.1问题: 仍有数据问题产生
2.2思路: 质量标准->强管控->定期扫描->体系化
2.3规范化

2.4强管控 
2.4.1 dqc 建议使用强规则(不合规,直接中断告警)
(dqc为了数据准确)
基础dqc 业务dqc
dqc问题治理:1.波动阈值修复/预测 2.未被引用数据模型sqc空跑

2.4.2 数据基线及sla 
(sla为了数据按时交付)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值