大家都在谈论的DT时代,数据为王,一切即数据,那么海量数据对无感知的人来说真的是空谈。
数据是真实存在的,既不是数据库存储的数据也不是数据报表的数据,那么大数据该是什么样子?大数据该以何种形式存在?如果才是数据思维该有的样子?
论证:Everything is data
马克思主义告诉我们:唯物主义-世界的本质是物质组成的。
-->物质是信息的载体-->信息是由数据构成的-->所以世界由数据组成。
显然在数据思维的逻辑和论证下,一切都是数据,对于海量的数据,不仅需要庞大的数据库来保存原始数据,还要保存经过简化、汇总和分析的数据,作为生成MIS和其他分析报告的来源,以供最高管理层决策。
大数据的广泛来源和量级
l 历史角度
第一次信息革命:语言的创造;
第二次信息革命:文字的出现;
第三次信息革命:印刷术的发明;
第四次信息革命:无线电的发面;
第五次信息革命:电视的出现;
第六次信息革命:计算机与互联网的使用;
l 哲学角度
1. 解决日益增长的大数据挖掘需求与落后的数据处理与分析能力之间的矛盾
2. 人类认识客观世界三种方法:
a. 基于模型的方法(白盒模型)
b. 基于经验的方法(灰盒模型)
c. 基于大数据的方法(黑盒模型)
l 技术角度
大数据特征:大杂全多块,久活简稀联。
我国网民的基础数量居世界之首,每天产生的数据量也位于世界前列:
1. 淘宝网站:单日数据产生量超过5万GB,存储量4000万GB。
2. 百度公司:目前数据总量10亿GB,存储网页1万亿页,每天大约要处理60亿次搜索请求。
3. 一个8Mbps的摄像头:一小时能产生3.6GB数据,一个城市每月产生的数据达上千万GB。
4. 医院:一个病人的CT影像数据量达几十GB,全国每年需保存的数据达上百亿GB。
大数据产生的原因
l 硬件成本降低。
l 网络宽带的提升。
l 云计算的兴起。
l 智能终端的普及。
l 电子商务,社交网络。
l 电子地图的全面应用。
l 物联网。
大数据提升的能力:
l 解决"坐井观天"问题
l 解决"一叶障目"问题
l 解决"瞎子摸象"问题
l 解决"城门失火,殃及池鱼"问题
l 提升"一叶知秋"能力
l 提升"运筹帷幄,决胜千里"能力