大数据概述(二)
一、大数据4V特征
1.数据量大(Volume):存储大,计算量大;
1.数据类型样多(Variety):来源多,格式多;
3.处理速度快(Velocity): 生成速度快,处理速度要求快。
4.价值密度低(Value):价值密度低,和数据总量的大小成反比。
二、第四范式
2007年,已故的图灵奖得主吉姆·格雷(Jim Gray,数据库基本理论的奠基人)提出了数据密集型科研"第四范式"(The Fourth Paradigm)。
1.第一种范式:实验科学
在最初的科学研究阶段,人类采用实验来解决一些科学问题,著名的比萨斜塔实验就是一个 典型实例。1590 年,伽利略在比萨斜塔上做了“两个铁球同时落地”的实验,得出了重量不同的 两个铁球同时下落的结论,从此推翻了亚里士多德“物体下落速度和重量成比例”的学说,纠正 了这个持续了 1 900 年之久的错误结论。
2.第二种范式:理论科学
实验科学的研究会受到当时实验条件的限制,难以完成对自然现象更精确的理解。随着科学 的进步,人类开始采用各种数学、几何、物理等理论,构建问题模型和解决方案。比如,牛顿第 一定律、牛顿第二定律、牛顿第三定律构成了牛顿力学的完整体系,奠定了经典力学的概念基础, 它的广泛传播和运用对人们的生活和思想产生了重大影响,在很大程度上推动了人类社会的发展 与进步。
3.第三种范式:计算科学
随着 1946 年人类历史上第一台计算机 ENIA