数据本身存在着从生产到消亡的生命周期,在数据的生命周期中,数据的价值会随着时间的变化而发生变化,数据的被采集粒度与时效性、存储方式、整合状况、呈现和展示的可视化程度、分析的深度,以及和应用衔接的程度,都会对数据的价值的体现产生影响。大数据的治理需要结合大数据生命周期的各个阶段的特点,采取不同的管理和控制手段。与传统数据生命周期出发点不同,大数据生命周期实践中,主要关注的是如何在成本可控的情况下,有效地使大数据产生更多的价值。
大数据的生命周期是指某个集合的大数据从产生和获取到销毁的过程。企业在大数据战略的基础上,定义大数据范围,确定大数据采集、存储、整合、呈现与使用、分析与应用、归档与销毁的流程,并根据数据和应用的状况,对该流程进行持续优化。大数据生命周期的过程如下:
大数据的生命周期管理与传统数据的生命周期管理虽然流程上比较相似,但因出发点不同,导致两者存在较大的差别,节省存储成本是传统数据生命周期管理重要的考量之一,注重的是数据的存储、备份、归档、销毁,考虑的是如何在节省成本的基础上,保存有用的数据。目前数据获得和存储的成本已经大大降低,大数据生命周期管理是以数据的价值为导向,对于不同价值的数据,采取不同类型的采集、存储、分析与使用策略。
大数据的