数据使用要谨慎——不良数据带来严重后果

 

对于很多企业来讲,大数据已成为日常经营中十分重要的一环,数据也已成为企业有价值的资产。咨询机构Digital Realty最近发布的一项研究表明,数据为全球最富裕的七个国家(G7)的经济贡献了超过1.7万亿美元。这一规模相当于全球第十大经济体,并高于韩国、俄罗斯和加拿大。

遗憾的是 ,对大数据的高度重视导致了一些不好的决策。很多实体以牺牲数据质量为代价换取数据的可扩展性。结果,不良的数据给他们引来了一大堆的问题。

仅美国,不良数据(任何结构或管理不善的数据)每年都会造成该国损失超3万亿美元。无论是数据工程师不小心添加了一个额外的零,还是事物格式的差异,甚至是数据系统本身的问题,数据都可能出现很多问题。

不良数据是指那些错误、不完整、无法理解、错位、不相关和过时的数据。在实践中,不良数据会浪费销售的时间,干扰数据科学家的工作,以及将IT的时间耗费在同步无法相互通讯的系统上。这一切都会导致人们对数据失信,令管理层无法果断决策。它还渗透到所有业务领域,从根本上影响工每个人的生活和工作。

不良数据对业务产生负面影响的主要方式有四种:

减慢决策速度

导致更高的成本

扰乱日常流程

降低客户参与度

 

那么,企业应采取哪些措施来清理数据呢?

集中:清理不良数据不可一蹴而就,需要以长远眼光看待问题。首先,不要把重点放在理顺数据进入企业的不同渠道上,而是专注制定一套集中化数据管理策略,同时确保能从源头对数据进行检测。

整合:在大型企业和机构内,不同部门运行着多个数据库,还有一些不为人知的数据来源。如果企业在不同地点有多个分支机构,情况会更为复杂。整合和分类数据库以及信息库可最大限度减少不良数据的产生,促进企业数据的标准化。

标准化:分析数据,加深对数据的认知。不良数据的一大成因是企业的数据收集过程缺乏标准化。必须在企业内部以及供应商、合作伙伴之间实施一套标准化参数,最大限度减少不良数据进入企业的途径。

调查:了解数据污染的根本原因。即利用对标数据进行数据基准校正,厘清数据污染的本质。这将有助于修正异常并将数据恢复到未受污染的初始质量。

消除:数据重复是数据不准确的主要原因之一,尤其是当存在多个数据库时。过程中人为失误则可能加剧这一问题。通过整合数据,我们有机会消除重复数据,以达到标准化的基准。这一过程可能需要花费一些时间,但也是快速获取客户信息和提高商业智能的必要条件。

清洗:云平台、尤其是混合云有大量数据清洗工具可供选择,提供了一个清洗、净化数据的理想环境。

随着我们进一步进入商业数字时代,数据——清晰、正确和干净的数据——对于持续进步至关重要。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值