大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。国内大数据应用已快十年,然而,对大数据应用的深入思考却没跟上,以统计分析的模式来想象大数据的应用,定格在信息获取方向上会影响在其它领域的应用创新。本文作者原国家信息中心副主任胡小明,从“大数据应用”的角度带来一些全新启发!
一、信息获取的大数据应用
1.1信息获取与知识发现
对大数据最容易想到的应用是信息获取,大数据应用经常被视为是统计分析模式的延伸,维克多·迈尔-舍恩伯格与肯尼斯·库克耶合著的《大数据时代》从信息获取、知识发现的视角提出了大数据应用带来的创新:一是使用全部数据替代抽样数据,二是允许数据的混杂型而非精确性,三是重视相关关系而非因果关系。大数据创新开辟了知识发现的新思路,促进了科学研究工作的发展。
1.2政府决策的大数据应用
大数据在知识发现中呈现出来的优势使政府产生用大数据实现决策科学化的构想,决策是领导者的行为,但是人脑无法直接使用大数据决策,数据所包含的内容要浓缩经过理解之后才能成为人脑中的信息,与人脑其它信共同参与决策。数据挖掘、统计分析都是对数据内容进行浓缩处理,形成人脑易于理解的信息内容,数据包含的信息要通过人脑在决策中发挥作用。
1.3政府大数据应用的局限性
大数据应用对政府决策的改进并不明显,否则不至于长期纂写不出政府大数据决策案例集。政府决策应用大数据困难主要有两点:
一是缺少适用的数据源,政府自己并没有多少大数据资源,适合当即需要决策问题的外部大数据也极难碰到;
二是很多重要信息如国际形势、重大事件、管理能力、社会文化很难数字化ÿ