当今世界,科技进步日新月异,互联网、云计算、大数据等现代信息技术深刻改变着人类的思维、生产、生活、学习方式。信息技术与经济社会的交汇融合引发了数据爆发式增长,数据已成为重要生产要素和国家基础性战略资源。近年来,国家统计局颁布了一系列推进大数据应用的重要举措,确定了“总体设计、牵头攻关、先易后难、专业突破”的总体思路和“打造中国政府统计数据来源第二轨”的工作目标,稳步推进大数据政府统计中的应用,加快推进大数据与政府统计工作深度融合。
一、什么是大数据
大数据(Big Data)被认为是新型战略性资源,能够帮助实现对经济社会发展的全面展现、精准预测和智慧决策。当前,对大数据的概念已经基本形成共识, 尽管在某些细节上还存在一些争议。中华人民共和国原国家质量监督检验检疫总局和中国国家标准化管理委员会于 2017 年 12 月 29 日发布了《信息技术 大数据术语》的国家标准(GB/T 35295-2017),并于 2018 年 7 月 1 起正式实施。该标准指出,大数据是“具有体量大、来源多样、生成极快、且多变等特征并且难以用传统数据体系结构有效处理的包含大量数据集的数据”。这种针对信息技术领域对大数据给出的定义,可以作为其他领域的重要参考。对政府统计而言,大数据通常被认为是采用多种数据收集方式、整合多种数据来源的数据,是采用现代信息技术和架构高速处理和挖掘、具有高度应用价值和决策支持功能的数据、方法及其技术集成。
二、大数据主要有哪些特征
一般认为,大数据的主要特征可以概括为四个“V”(见右图):
大数据的主要特征
第一,数据体量巨大(Volume)。目前人类社会的数据集规模已经从 GB 到 TB 再到 PB,甚至到了以 EB 和 ZB