数仓-数据治理

数据治理目的:清晰企业数据资产,对资产进行全面梳理

数据治理这一块做过的实际项目

  • 原生集群
    专项治理
    采集集群元数据信息:
    1)对表的元数据和业务元数据进行合并,一方面做成数据字典,方便数仓之外人员查看,另一方面可以监控到资源占用较多的任务和表,分别处理小文件和清除僵尸数据,做ddl控制
    2)对集群元数据进行合并,监控资源使用情况,峰值,合理安排任务运行时间,错峰,削峰,监控任务运行情况
    3)数据质量,老生常谈,数据服务SLA基本靠数据质量来保证,必做空值,重复值,枚举值验证,交叉验证
    在做:
    1)血缘,快速追踪任务上下游,修数据,字段级别和表级别
    2)热力图,访问情况

  • 阿里云dataworks一站式开发平台
    1)针对公司开发规范落地情况进行校验(事中校验),标准sop执行
    使用py脚本对提交任务进行检查
    2)数据安全(字段等级划分 -> 动态、静态加密)

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值