数据治理案例 | 某大型集成电路企业数据质量管理实践

项目背景

某大型集成电路企业是一家集芯片设计、工艺研发、晶圆生产与测试、销售服务于一体的半导体存储器企业,为全球提供先进的存储产品和解决方案,广泛应用于移动通信、计算机、数据中心和消费电子领域。该企业在数据管理系统和研制管理体系的控制下,设计、工艺、制造、试验、售后服务等环节都产生了大量的数据。在管理信息化、工程信息化的建设过程中,为减少信息孤岛,数据集成与共享不可逾越,不同系统间的数据正确性、一致性变得尤为重要。

当前该企业数据资源涉及7000-8000张数据库表,存储于不同的关系型数据库以及分布式数据库中,每天的增量数据在1-2T左右,在ETL过程中需要对数据的及时性、完整性和一致性进行校验。同时需要对互相有关联的业务数据进行业务规则校验,各式各样复杂的业务规则逻辑需要依靠业务骨干的工作积累和经验反复推敲才能落地,单靠技术部门的投入难以达到最好的效果。

综上,该企业需要一款独立于业务系统之外的数据质量管理平台,一方面满足技术部门长效的数据质量管控,另一方面能够形成业务精英为主、技术精英为辅的业务数据梳理体系。

痛点难点

该集成电路企业在发展过程中积累了大量的项目、客户、设备、产品等数据,随着数据共享以及决策的需求,以及数据使用范围的扩大,在使用过程中发现了大量数据问题,归纳如下:

1、需支持多样化的数据来源

当前业务数据存储在不同类型的数据库中,包含Oracle/Mysql/SQLServer/Postgresql/Hive/HDFS/Hbase/Kudu/Vertica等,所选平台需要具备多种数据源的接入机制,并能够基于后续的业务发展,适用更多的数据来源。

2、需支持繁简不一的规则配置

在数据质量管控过程中,需要进行各种各样的质检规则配置,简单的如空值校验、字段类型校验、值域校验、及时性校验等,复杂涉及多表关联的逻辑公式校验、完整性校验、一致性校验等,所选平台需要支持多种规则的校验设置,同时还要便于技术能力较弱的业务精英进行操作。

3、需支持海量数据的处理应对

面对海量数据的质检,不仅是数据量大,同时还面临多个质检工作的并发。一方面需要在规定时间内完成所有检验,另一方面给还需要及时将结果反馈给数据管理者。所选平台需要具备大数据量的处理能力、支持多个质检进程并发,同时还要考虑后续数据量越来越大,接入的数据源越来越多的发展趋势,能够支持集群中节点的灵活扩展,满足长期的数据质检需要。

看似表面的数据问题其实会对业务带来严重的影响,数据不真实、不准确、不共享,增加企业经营风险、管理难度和复杂度,跨组织信息共享程度低、资源难于整合。如何更好地管理和控制数据,做好数据质量平台建设,成为企业迫在眉睫的任务。

建设内容

本项目的建设内容就是从数据接入、转换、应用各个阶段加强数据质量的管控,为集团数仓、数据分析、数据挖掘应用提供标准、可靠的基础数据支撑。

​该企业利用亿信华辰睿治数据治理软件搭建数据质量管理平台,主要用于解决业务系统运行、数据仓库建设及数据治理过程中的数据质量问题。它以标准化的数据质量规范为基础,运用数据挖掘、数据分析、工作流、评分卡、可视化等技术帮助组织建立数据质量管理体系,提升数据的完整性、规范性、及时性、一致性、逻辑性,降低数据管理成本,减少因数据不可靠导致的决策偏差和损失。

系统主要功能包括质量检查规则管理、绩效管理、工作流管理、质量分析报表查询、质量报告等。

平台架构图

1、单点登录

为满足公司内部的通过统一身份认证平台进行数据质量平台的登录,实现了与认证平台的单点登录集成。

2、质量问题实现短信预警

数据质量平台支持按照配置的质检方案自动的执行质检,质检结果会自动的通过邮件或者短信发送到相关责任人,提醒技术人员及时的处理质量问题。

3、支持多种大数据平台数据源的质检

平台除了支持常见的关系型数据库数据进行质检外,还支持Hive/HDFS/Hbase/Kudu/Vertica等多种大数据库的数据源接入,能够满足公司后续的业务发展,适用丰富的数据类型。

项目价值

该企业数据质量管理平台的建设,满足了公司数据质量管控的需求,实现了数据质量检查的自动执行和问题数据短信预警,大大地提升了业务数据的质量,为公司数仓、数据分析、数据挖掘应用提供标准、可靠的基础数据支撑。客户对于项目整体建设成果非常满意,通过产品的应用,使各业务条线的数据质量问题得到有效管控,简化技术人员的数据质量问题核查的工作难度,同时极大地提升了客户的工作效率。

1)数据质量管理平台提供了可视化的页面就能完成数据质量检查工作,大大降低了数据质检的技术门槛,不仅仅只靠公司数据部门的技术人员来提升数据质量,现在也将业务部门的人员也参与到数据质量提升工作中,形成业务精英为主、技术精英为辅的业务数据梳理体系。

2)数据质量的质检结果实现了短信自动预警,提醒技术人员及时处理质量问题,提升了技术部门的数据质量问题管理效率。

3)随着公司业务数据不断增大,大数据平台的应用不断深入,数据质量平台支持多种基于Hadoop的数据源的接入进行质检,为公司业务的发展和质量管理奠定了基础。

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据治理全球态势; 数据合规法规标准及热点案例汇编; 数据安全标准与产业实践; DT时代的数据流动风险防治; 基于人工智能的大数据安全; 厂商数据安全解决方案; 数据治理总体解决方案; 数据安全治理解决方案; 【业内权威】数据安全治理建设指南; 企业数据防泄密体系咨询服务全套资料; 阿里云大数据安全实践大数据安全等级保护的挑战与应对; 基于风险的数据完整性管理实践指南; 数据安全管理办法; CSA大数据安全和隐私手册中文版; GDPR数据合规; 从数据资产管理看数据安全管控; 大数据安全治理汇编(总4篇); 大数据安全标准; 大数据环境下的隐形隐私安全; 大数据环境下隐私保护与风险管控技术; 大数据时代下的隐私保护; 等保2.0数据安全解决方案; 国际数据管理能力成熟度评估模型; 华为数据安全管理实践企业数据安全能力框架_数据安全能力成熟度模型的构建及应用; 企业数据管理理论与实践; 从0到1打造企业数字化运营闭环白皮书; 数据安全白皮书; 数据安全能力建设实施指南; 数据安全治理白皮书及PPT; 数据安全治理方案; 数据安全综合防御体系; 数据出境方案 ; 数据安全治理技术支撑框架; 金融数据安全治理模型与实践; 包括但不限于以上资料,共127份之多。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值