所谓的数据质量

点击上方蓝色字体,选择“设为星标

回复”资源“获取更多资源

导读:随着大数据行业的深入发展,数据质量越来越成为一个绕不开的话题,那当大家在聊数据质量的时候,通常会聊什么呢?从什么是数据质量开始。

数据质量:一个评估规则维度提供一种测量与管理信息和数据的方式。

区分规则维度有助于:

  • 将维度与业务需求相匹配,并且划分评估的先后顺序;

  • 了解从每一维度的评估中能够/不能够得到什么;

  • 在时间和资源有限的情况下,更好地定义和管理项目计划中的行动顺序。

数据质量检核主要分为以下规则维度:

完整性(Completeness):用来描述信息的完整程度。
唯一性(Uniqueness):用来描述数据是否存在重复记录,没有实体多余出现一次。
有效性(Validity):用来描述模型或数据是否满足用户定义的条件。通常从命名、数据类型、长度、值域、取值范围、内容规范等方面进行约束。
一致性(Consistency):用来描述同一信息主体在不同的数据集中信息属性是否相同,各实体、属性是否符合一致性约束关系。
准确性(Accuracy):用来描述数据是否与其对应的客观实体的特征相一致(需要一个确定的和可访问的权威参考源)。
及时性(Timeless):用来描述从业务发生到对应数据正确存储并可正常查看的时间间隔程度,也叫数据的延时时长,数据在及时性上应能尽可能贴合业务实际发生时点。
可信性(credibility):用来描述数据发生是否符合客观规律。

每一规则维度可能需要不同的度量方法、时机和流程。这就导致了完成检核评估所需要的时间、金钱和人力资源会呈现出差异。数据数据质量的提升不是一蹴而就的,在清楚了解评估每一维度所需工作的情况下,选择那些当前较为迫切的检核维度和规则,从易到难、由浅入深的逐步推动数据质量的全面管理与提升。规则维度的初步评估结果是确定基线,其余评估则作为继续检测和信息改进的一部分,作为业务操作流程的一部分。

数据完整性维度大类下可细分为以下维度小类:

非空约束:描述检核对象是否存在数据值为空的情况。如客户开户时,客户名称是必填项,不能出现为空的情况。

非空约束 非空约束比较容易理解,简单的讲就是字段不能为空,检查方式也比较容易,只需要设定需要检查的字段,通过 sql 查询列值不能为空即可。将为空的数据查询出来进行整改。
当然非空约束可以通过设置非空约束的方式限制数据无法写入数据库,如果支持这种方式可以避免事后的数据非空检查。

数据唯一性维度大类下可细分为以下维度小类:

唯一性约束:描述同一客观实体在不同业务数据集中的信息,经整合后是唯一的,针对目标通常是单一主键或联合主键,如证件类型+证件号码+姓名相同,则其客户编号应唯一。

唯一性约束 举个简单的例子,唯一性约束在技术上一般具备唯一的标识字段可以判断其唯一性,在业务上可以通过几个关联的业务属性对确定唯一业务实体。若在这种情况出现数据重复的问题,即违反了唯一性约束。这种情况的如果是单一的业务主键,可以通过对主键分组去重的方式检查,如果是业务联合属性判断唯一实体的情况只能业务人员进行手动检查。

数据有效性维度大类下可细分为以下维度小类:

代码值域约束:描述检核对象的代码值是否在对应的代码表内。如业务规则定义“性别”的取值应该是“1-未知的性别”、“2-男性”、“3-女性”、“4-未说明的性别”,如果出现“A”、“B”这样的取值,则认为“性别”的代码值域存在问题;
长度约束:描述检核对象的长度是否满足长度约束。如“金融机构编码”在《人民银行金融机构编码规范》中规定长度为14位,如果出现非14位的值,则判定为不满足长度约束,不是一个有效的“金融机构编码”;
内容规范约束:描述检核对象的值是否按照一定的要求和规范进行数据的录入与存储。如“存款账号”应仅含数字,如果出现字母或其他非法字符,则不是一个有效的“存款账号”,不满足内容规范约束;
取值范围约束:描述检核对象的取值是否在预定义的范围内。如“授信额度”取值范围应大于等于 0,如果出现小于 0 的情况,则超出了取值范围的约束,不是一个有效的“授信额度”;

代码值域约束

描述检核对象的值是否按照一定的要求和规范进行数据的录入与存储。
例 1 : 依业务规则性别只有 “0:男” ,”1:女”,则性别字段只应出现0或1。
例 2 : 货币代码 (CURCODE) 只应有RMB或是USD值。
数据质量中代码值域首先要指定企业级的统一编码表,然后按照对照关系进行 etl 转换,至于出报告只需要通过 sql 查询不再范围内的数值就可以了。

长度约束

描述检核对象的长度是否满足长度约束。
例如身份证号是 18 位。
长度约束可以通过建表时指定字符长度去限制,如果业务系统最初没有做限制,只能通过 sql 判断长度的方式获取异常值再进行处理。

内容规范约束

描述检核对象的值是否按照一定的要求和规范进行数据的录入与存储。
例如:余额或者日期等一般都会按照固定类型存储,如果最初设计为字符型后续应按照对应类型调整。
首先这种情况最好一开始就建立好统一规范,按照业务含义去指定技术类型。如果最初做的不好,可以通过类型进行数据探查,对数据统一格式化。

取值范围约束

描述检核对象的取值是否在预定义的范围内。
例如:余额不能为负数,日期不能为负数等等。
如果业务初始没有做限制,只能通过 sql 去对数据过滤查询,对有问题数据集中 etl 处理。

数据一致性维度大类下可细分为以下维度小类:

等值一致性依赖约束:描述检核对象之间数据取值的约束规则。一个检核对象数据取值必须与另一个或多个检核对象在一定规则下相等。
存在一致性依赖约束:描述检核对象之间数据值存在关系的约束规则。一个检核对象的数据值必须在另一个检核对象满足某一条件时存在。
逻辑一致性依赖约束:描述检核对象之间数据值逻辑关系的约束规则。一个检核对象上的数据值必须与另一个检核对象的数据值满足某种逻辑关系(如大于、小于等)。

等值一致性依赖约束 一般指外键关联的场景。例如:保单表,理赔表的保单号存在保单主表,同一张表,两个字段之间的关联关系。

存在一致性依赖约束 主要是强调业务的关联性,一个状态发生了则某个值一定会如何。
例如:投保状态为已投保,则投保日期不应为空;

逻辑一致性依赖约束 主要强调的是字段间的互相约束关系。
例如:投保开始时间小于等于投保结束时间

数据准确性主要是指取值的准确性,描述该检核对象是否与其对应的客观实体的特征相一致。

例如:投保人的性别代码为 0-女性,虽然满足代码值域约束,但却不满足取值准确性约束,因为该人为男性,其性别代码应为 1-男性
再如:国际保函业务的手续费应录入为国际担保手续费收入,却录入成国内担保手续费收入
准确性要求不仅数据的取值范围和内容规范满足有效性的要求,其值也是客观真实世界的数据。由此可见,有效的数据未必是准确的,反之成立。
准确性通常需要业务人员或其他当事人手工核查。

对待这种情况,数据质量规则没办法直接统一处理,只能通过即使查询的方式对数据结果进行详细核查。

及时性约束:描述检核数据能否及时反映其对应的实际业务的时点状态。
例如:系统中贷款五级分类的分类比实际中的延迟几天变化;再如理财业务在理财系统中是成功状态,但在核心系统中却因通信的原因而没有入账。
及时性由于多个系统、通信等原因而造成,通常需要业务人员或系统人员手工核查。
一般来说数据同步都是基于业务系统的落表技术字段(比如:CREATE_DT),而真是业务发生的时间可能与该字段存在时间间隔。可以通过简单的sql对两个时间比较,判断数据的及时性是否符合需求。

数据可信性约束:描述再数据同步中每日/月增量数据是否符合理论的经验值。
例如:保单数据的每日分区数据较前日一般有 10% 增长,突然数据增长变为200%,这种情况有可能时数据同步出现问题。
再如:每月的营收总额一般都按一定规律上涨,突然数据波动较大则一般都可能出现问题。
可信性要求数据的总量波动符合基本客观规律,一般通过对 7,15,30 日数据进行比较,如果出现差距较大则进行详细的问题探查。

Flink on YARN模式下TaskManager的内存分配探究

业务和管理决定上限,技术决定下限

脱离ZooKeeper依赖的Kafka Controller Quorum(KRaft)机制浅析

背景调查时在调查些什么?

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
C语言与数据结构 1.基本概念和术语 1)数据:是对客观事物的符号表示。在计算机科学中其含义是指所有能够输入到计算机中并被计算机程序处理的符号集合。 2)数据元素:是数据集合中的一个实体,是计算机程序中加工处理的基本单位。 数据元素按其组成可分为简单型数据元素和复杂型数据元素。简单型数据元素由一个数据项组成,所谓数据项就是数据中不可再分割的最小单位;复杂型数据元素由多个数据项组成,它通常携带着一个概念的多方面信息。 3)数据对象:是性质相同的数据元素的集合,是数据的一个子集。 4)数据结构:是一门研究非数值计算的程序设计问题中计算机的操作对象以及它们之间关系和操作等的学科。或者说,数据结构是相互之间存在一种或多种特定逻辑关系的数据元素的集合。数据元素之间的相互关系称为结构(Structure)。 一、考点: 了解C语言的特点 掌握C语言程序的构成和书写风格。 二、知识点: 1、C语言的特点: 1)C语言简洁紧凑,压缩了一切不必要的成分。 2)C语言运算丰富,将括号、赋值、强制类型转换、取变量地址等都以运算实现。 3)C语言数据类型丰富,具有现代语言的各种数据类型,用户还能扩充它,实现各种复杂的数据结构,完成各种问题的数据描述。 4)C语言是一种结构化程序设计语言,层次清晰,便于按模块化方式组织程序,易于调试和维护。C程序由若干程序文件组成,一个程序文件由若干函数构成。 5)C语言可以直接访问物理地址,进行位(bit)一级的操作,能实现汇编语言的大部分功能。 6)C语言提供了预处理机制,有利于大型程序的编写和调试。 7)C语言生成的目标代码质量很高,程序执行效率很高。 8)用C语言写的程序可移植性好。 9)C语言语法限制不太严格,程序员设计自由度较大
普元大数据治理提高数据质量 作者:赵明 来源:《中国计算机报》2016年第27期 在数字化转型过程中,大数据的作用是什么?虽然很多人都看好大数据产业的 发展,但是到底什么样的数据能发挥价值,帮助企业快速发展,这才是数据真正的意义 。在大数据时代,数据已经成为某种意义上的战略资源。大数据的广泛应用,可以使生 产型企业进一步提升生产率,使企业资产增值。 数据是企业的核心资产,使用数据的能力决定了企业的竞争力,数据驱动企业 发展,数据是估值企业的关键指标。很多企业在数字化转型过程中需要大数据为它提供 精准的分析结果。那么,如何才能提供精准的结果?首先最基本的要求就是数据质量要 高。普元信息软件产品部副总经理、大数据产品线总经理王轩认为:"企业数字化转型需 要以高质量数据作为基础。企业有了高质量数据,就能够加速它的数字化转型的过 程。" 在数字化转型过程中,很多传统行业希望把出售数据作为其利润增长点。但是 如果想把数据当作商品出售,那么至少需要这个数据是有质量保障的。但目前情况下, 这些数据有非常多的问题。虽然很多企业经过了这么多年的IT建设,但数据模型并不统 一,没有统一的数据标准,也没有数据质量的检测体系。没有统一的标准,就没有质量 控制的能力,高质量数据就无从谈起。王轩表示:"一些企业已经意识到在数据资产化 之前,第一步应该先进行数据治理。只有数据质量提高了,才能实现数据资产化。" 数据治理的本质是什么?数据治理的本质就是使数据和服务更加紧密地结合, 实现数据的内在价值,为企业提供新的利润增长点。但在数据治理过程中,企业中每个 业务部门都认为它的数据是正确的,但从宏观角度来看,业务部门之间的数据是不一致 的,这其实就是数据质量问题。 确保数据质量 在做数据分析时,如果应用错误的数据做分析,那么不论分析的方法精准与否 ,分析的速度多快,都无法得出正确结果。因此,首先要确保数据质量。要想确保数据 质量就要做数据治理,而做数据治理,并非一次性的工作。 "它绝对不是一个毕其功于一役的事,它需要一个长期的过程,也需要很好的平 台。"王轩认为,"很多项目分析结果出来以后,项目是失败的,主要原因是分析的结果 都是错的。没法保证分析结果是对的。我们需要用大数据治理支撑整个上层用户。真正 的大数据治理,尤其是大企业做数据治理,它是一个全过程和全方位的事情。"数据治理 需要有一个很好的技术平台,但仅仅依靠技术平台是不够的。在技术平台之外,需要有 一系列与业务相关的协作,包括数据标准、数据质量等一系列工作要完善,共同完成大 数据治理任务。 当企业意识到数据有问题时,通常分析结果已经出错,然后才去检查数据,进 行数据治理,这事实上已经是亡羊补牢的做法。因此,要防患于未然,在数据采集、数 据交换等每一个环节都做数据治理。而数据治理还需要针对不同行业特点,比如,金融 、电信和能源等行业的数据信息标准就不同,不可一概而论,需要建立不同行业的数据 标准。 数据标准化是企业信息化建设最根本、最基础的工作,数据标准化工作做得好 ,会为后续的BI、大数据分析打下坚实的基础。但数据标准化工作是个费力不讨好、非 常不容易开展的工作,越来越多的企业在数据标准化的过程中发现了企业管理上的诸多 问题,甚至影响到了企业利益,那么企业应该如何开展数据标准化相关工作? 普元信息大数据产品部资深架构师袁锋涛认为:"数据标准是增强企业各部门对 业务统一理解的手段,是企业在开发应用系统时对数据进行定义的依据。数据标准化是 面向企业顶端的,是伴随企业体系化建设的长久之路。" 数据标准体系完善的过程,是通过各种手段、方式、渠道,建立数据标准体系 的过程。在此过程中企业应以元数据管理为基础,推动数据标准在各应用系统中的执行 ,逐步形成常态化的、闭环的标准体系应用机制,从整体上提升企业的数据质量数据 管理水平,为实现企业数据流的畅通和全系统信息资源的共享奠定基础。 只有数据标准逐步完善,才有可能进行准确的数据治理,对大数据实施全过程 、全方位的管理。很多人在做数据治理的时候,往往只集中在数据应用环节,范围过窄 。在整个过程中,要从数据应用、数据传输、数据存储等环节全面去做数据治理,在每 一个环节都需要控制数据的标准和质量。 如何判定数据是否存在价值 世界上没有废物,只是没放对地方。这是很多环保人士市场挂在嘴边的一句话 。而数据,也可以套用这种思维方式。 所谓无用的数据,某些是在处理中发现确实数据有错误,需要治理,但也有一 些数据看似与以前或者当下业务无关的数据。但这类数据未必对未来业务没有帮助,或 许有其他价值,那么普元是如何区分和处理这些数据的呢? 王轩表示:"首先数据都是有价值的,但是企业的核心的数据一定要是准确的, 外围的数据可以暂时搁置一边。普元目前提出的数据标准是相对狭义的,我
税收收入核算数据工作调研 随着计算机技术的广泛应用,依靠计算机进行数据管理,已被愈来愈多地运用到社 会各个领域。计算机处理数据的准确快捷,不仅使人们在工作中节省了大量的人力和时 间,而且为人们生活、社会经济和管理带来了难以估量的巨大效益,信息数据已经成为 21世纪第四大资源。计算机数据管理在国税系统同样发挥着主要作用。以综合税务征收 管理软件的推广为标志,计算机数据管理已渗透到税务工作的各个环节。从纳税人进行 税务登记,到录入纳税申报信息进行收入汇总统计,到计会部门税票核销、金库对账, 到税收会计账,不难看出各项业务工作已越来越离不开计算机系统中的数据信息。税务 系统数据管理工作中对数据信息这一宝贵资源的利用方面还存在不少问题亟待解决。我 就此类问题结合工作实际谈几点看法。 数据管理的概念 数据管理是指通过对数据的采集、审核、调整、存储、传输、发布等过程进行合理有效 的计划、组织、协调和监督,以保证数据质量与时效,提高数据利用效率的一种职能 活动。根据税务部门目前工作的实际情况,数据管理的对象是税收业务数据及相关数据数据管理工作与当前税务系统设置的数据处理中心的工作存在明显的不同:数据处理 中心的工作是解决如何对数据进行加工和整理的问题,强调对具体数据操作行为的规范 。它是税收整体业务流程的一部分,它的工作目的是满足各类工作需要;而数据管理工 作是对数据操作行为实施的管理,强调对数据操作过程的控制与监督,它的工作目的是 保证数据质量的时效。 二、提高税务系统数据管理工作的建议 (一) 在税务系统明确设立数据管理工作职能部门,在全局范围内建立统一管理与具体工作各 负其责、相结合的数据管理工作机制,以解决目前数据信息由各业务科分散管理、管理 环节多,各部门都管却管不好、缺乏协调配合的问题。笔者认为新成立的数据管理职能 部门的职责包括以下几个方面: 1、负责协调、统一、维护全局性的数据口径。 2、负责建立全局性的数据管理规章制度。 3、负责培训各科数据管理员。 4、负责日常性的审核、调整、修改数据信息。其中要负责编写涉 及各类数据管理自动检错、纠错程序,使数据检查、修改、调整尽可能地利用计算机的 自动化手段完成。 5、负责对各科的数据管理工作进行考核评价。 在上述职责中笔者认为负责日常性的审核、调整、修改基本信息,应是数据管理职能部 门最主要的任务。 (二)在设立数据管理职能部门的同时,笔者建议尽快在税务系统建立一支高素质、高水 准的数据管理员队伍。笔者个人认为,计算机操作水平高、工作责任心强、实际工作经 验丰富的税务人员胜任数据管理员岗位。 (三)在上述数据管理机构和人员确定之后,应在全局范围内建立数据统一管理与具体工 作各负其责相结合的工作机制。统一管理的含义是数据管理职能部门按照全局的部署进 行组织协调,而所谓具体工作各负其责的含义是各业务科室都有着各自的业务管理职能 ,因此各业务科也必须承担它所直接管理的业务数据的监督、管理责任。由于计算机使 每个使用者都可以从系统中输入、输出数据,实际上输入和输出的过程也是一个对数据 的时效性和准确性监督的过程,因此各业务科的使用者在操作数据的过程中也负有监督 管理的责任。所以数据管理不能光靠一个专门的职能部门监督管理,它必须由各业务科 在日常工作中对所发生的数据问题进行监督管理,只有这样才能使全局实现真正意义上 的数据管理。 关于如何处理统一管理与各部门各负其责的关系,笔者认为日常工作中只涉及到的问题 由数据管理职能部门和该部门数据管理员、主管局长研究解决,对涉及全局大多数科的 重大问题应召开数据管理的例会,由局领导统一研究后,交由数据管理职能部门查找解 决。 (四)要根据数据采集、录入环节的特点采取相应的数据管理办法,以堵塞数据管理方面 存在的漏洞。 1、对数据采集环节加强辅导,强化管理,以解决源头数据错误率高的问题。把对纳税人 的宣传辅导作为一项长期的纳税服务工作来抓,除了对新纳税户的培训辅导外,对老纳 税户的财务人员也要进行填税表(票)的培训。同时充分利用社会中介组织为纳税人提 供纳税服务,以提高纳税人纳税申报水平和填写各种税务报表的质量,这项工作要作为 加强数据管理工作中一项长期的基础工作来抓。 2、对数据录入环节加强培训,强化考核,以解决受理申报人员录入水平低、责任心不强 的问题。建议将开展的打字技能培训考试坚持开展下去。通过某局进行的培训考试,发 现原来大多数在受理申报窗口对计算机数字键盘操作不熟练的同志,经过培训练习,对 数字键盘操作比过去规范熟练多了,这样就会对今后纳税申报录入质量的提高打下良好 的基础。但是如果想从根本上提高税务部门数据录入质量,笔者建议应对前台申报录入 制定严格的考核制度以及一系列检查数据质量的办法,同时要将考核制度列入各局全年 的目标管理考核
普元大数据治理提高数据质量 作者:暂无 来源:《中国储运》 2016年第7期 本报记者赵明 数据是企业的核心资产, 使用数据的能力决定了企业的竞争力, 数据驱动企业发展,数据是估值企业的关键指标。很多企业在数字化转型过程中需要大数据为它提供精准的分析结果。那么,如何才能提供精准的结果? 首先最基本的要求就是数据质量要高。普元信息软件产品部副总经理、大数据产品线总经理王轩认为:"企业数字化转型需要以高质量数据作为基础。企业有了高质量数据, 就能够加速它的数字化转型的过程。" 在数字化转型过程中, 很多传统行业希望把出售数据作为其利润增长点。但是如果想把数据当作商品出售, 那么至少需要这个数据是有质量保障的。但目前情况下,这些数据有非常多的问题。虽然很多企业经过了这么多年的IT 建设,但数据模型并不统一,没有统一的数据标准,也没有数据质量的检测体系。没有统一的标准,就没有质量控制的能力,高质量数据就无从谈起。王轩表示:"一些企业已经意识到在数据资产化之前,第一步应该先进行数据治理。只有数据质量提高了,才能实现数据资产化。" 数据治理的本质是什么? 数据治理的本质就是使数据和服务更加紧密地结合,实现数据的内在价值,为企业提供新的利润增长点。但在数据治理过程中,企业中每个业务部门都认为它的数据是正确的,但从宏观角度来看,业务部门之间的数据是不一致的, 这其实就是数据质量问题。 确保数据质量 在做数据分析时, 如果应用错误的数据做分析, 那么不论分析的方法精准与否,分析的速度多快,都无法得出正确结果。因此,首先要确保数据质量。要想确保数据质量就要做数据治理, 而做数据治理,并非一次性的工作。 "它绝对不是一个毕其功于一役的事,它需要一个长期的过程,也需要很好的平台。"王轩认为,"很多项目分析结果出来以后,项目是失败的,主要原因是分析的结果都是错的。没法保证分析结果是对的。我们需要用大数据治理支撑整个上层用户。真正的大数据治理,尤其是大企业做数据治理, 它是一个全过程和全方位的事情。"数据治理需要有一个很好的技术平台, 但仅仅依靠技术平台是不够的。在技术平台之外,需要有一系列与业务相关的协作,包括数据标准、数据质量等一系列工作要完善, 共同完成大数据治理任务。 当企业意识到数据有问题时, 通常分析结果已经出错,然后才去检查数据,进行数据治理, 这事实上已经是亡羊补牢的做法。因此,要防患于未然,在数据采集、数据交换等每一个环节都做数治理。而数据治理还需要针对不同行业特点,比如,金融、电信和能源等行业的数据信息标准就不同, 不可一概而论,需要建立不同行业的数据标准。 数据标准化是企业信息化建设最根本、最基础的工作,数据标准化工作做得好,会为后续的BI、大数据分析打下坚实的基础。但数据标准化工作是个费力不讨好、非常不容易开展的工作,越来越多的企业在数据标准化的过程中发现了企业管理上的诸多问题,甚至影响到了企业利益,那么企业应该如何开展数据标准化相关工作? 普元大数据治理提高数据质量全文共3页,当前为第1页。 普元大数据治理提高数据质量全文共3页,当前为第1页。 普元信息大数据产品部资深架构师袁锋涛认为:"数据标准是增强企业各部门对业务统一理解的手段,是企业在开发应用系统时对数据进行定义的依据。数据标准化是面向企业顶端的,是伴随企业体系化建设的长久之路。" 数据标准体系完善的过程,是通过各种手段、方式、渠道,建立数据标准体系的过程。在此过程中企业应以元数据管理为基础,推动数据标准在各应用系统中的执行,逐步形成常态化的、闭环的标准体系应用机制,从整体上提升企业的数据质量数据管理水平,为实现企业数据流的畅通和全系统信息资源的共享奠定基础。 只有数据标准逐步完善,才有可能进行准确的数据治理,对大数据实施全过程、全方位的管理。很多人在做数据治理的时候,往往只集中在数据应用环节,范围过窄。在整个过程中,要从数据应用、数据传输、数据存储等环节全面去做数据治理,在每一个环节都需要控制数据的标准和质量。 如何判定数据是否存在价值世界上没有废物, 只是没放对地方。这是很多环保人士市场挂在嘴边的一句话。而数据, 也可以套用这种思维方式。 所谓无用的数据, 某些是在处理中发现确实数据有错误,需要治理,但也有一些数据看似与以前或者当下业务无关的数据。但这类数据未必对未来业务没有帮助,或许有其他价值,那么普元是如何区分和处理这些数据的呢? 王轩表示:"首先数据都是有价值的, 但是企业的核心的数据一定要是准确的,外围的数据可以暂时搁置一边。普元目前提出的数据标准是相对狭义的,我们首先要抓住核心点, 确保企业最有价值的那些数据准确。对于那些边缘数据,理想的做法是将其先存储,再进行分析、挖掘,从中获取其它有价值的内容。" 如何治理 数据治理过程中,IT 部门成了数据治理

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值