Form--> 大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活 平装 – 2013年4月1日 涂子沛 (作者)
最小数据集(Minimum Data Set,MDS)
最小数据集的概念起源于美国的医疗领域,用来统一医疗账单.
最小数据集是指通过收集最少的数据,最好地掌握一个研究对象所具有的特点或一件事情、一份工作所处的状态,其核心是针对被观察的对象建立一套精简实用的数据指标.
最小数据集的出现,最早是因为不同组织之间信息交换的需要,例如,两个医院之间,医院和政府医疗管理部门,医院和保险公司之间以及一些社会福利部门之间,都有交换信息的需要.随着最小数据集的推广,越来越多的社会组织、地方政府和联邦政府的业务部门之间都建立了标准的"数据接口",从此彼此"数据"相连.
信息管理系统的兴起把最小数据集的应用推上了新的高度.
所谓的"信息管理系统",也就是实现某一特定业务管理功能的软件.
软件的构成,主要有两部分,一是程序(也可称为代码),二是数据(或称为数据库).程序和数据的关系,就好像发动机和燃料,所有的程序,都是靠数据驱动的;数据之于程序,又好比血液之于人体,一旦血液停止流动,人就失去了生命,代码也将停止运行.
数据的生命力,甚至比程序更持久.程序可以不停地升级、换代甚至退出使用,但保存数据的数据库却会继续存在,其价值很可能与日俱增、历久弥新。世界万维网之父蒂姆-伯纳斯-李,曾经在2006年这样论述说:“数据是宝贵的,它的生命力,比收集它的软件系统还要持久。”
对于软件开发而言,数据库的设计甚至比程序的设计还要重要。埃里克-雷蒙,是美国软件开源运动的领袖,他在谈到代码和数据时曾表示:“一个好的数据结构和一个糟糕的代码,比一个糟糕的数据结构和好的代码要强多了。”
而大数据,将成为我们下一个观察人类自身社会行为的“显微镜”和监测大自然的"仪表盘";
数据治国
尽管信息时代的技术进步已经彻底改变了商业领域和体育运动领域的决策过程,但联邦政府对这些新技术的应用还仅仅处在一个开始的阶段.要实施"数据驱动的决策方法"(Data-Driven Decision Making),我们不仅仅要使用新的技术、还要改变目前的决策过程.
爱德华-戴明:"我们信靠上帝.除了上帝,任何人都必须用数据说话."
这种"迷信",对联邦政府而言,已经不仅仅停留在"用数据来说话"的层次了.近年来,随着大数据的迅猛增加,各个政府部门都在尝试"用数据来决策"、“用数据来管理”、“用数据来创新”,在这个过程中,涌现了一大批既务实管用、又令人耳目一新的做法和应用。