数据——简而言之,就是对人类的行为及产生的事件的一种记录
大数据核心工作:存储、计算、传输
大数据的历史
上世纪50年代 ,人们用纸笔记录数据
上世纪70年代前,计算机可以单独处理数据
上世纪70年代后,出现了基于TCP/IP协议的小规模的计算机互联互通。(互联网的雏形)
上世纪90年代后,互联网出现。
2000年后,数据量剧增————此时,超大规模数据导致计算机无法处理
巨大的数据量和羸弱的单机性能,让许多科技公司尝试以数量来解决————在此过程中,分布式处理技术————即大数据技术诞生
2008年,Apache Hadoop开源,广大企业拥有了成熟的、开源的、分布式数据处理解决方案
Hadoop
Hadoop HDFS | 分布式数据存储技术 |
Hadoop MapReduce | 分布式数据计算技术 |
Hadoop YARN | 分布式资源调度技术 |