这几年,互联网热潮掀起,大数据时代来临,好多厂商开始搞起大数据的开发,hadoop成为大数据的首选
hadoop基本入门:hadoop定位是大数据的分布式的存储与计算,这其中涉及到分布式,存储和计算这几个概念。
- 分布式:多台主机进行冗余存储后,然后并行计算实现大数据的快速检索功能。
- 存储:类型我们pc的文件管理系统一样,hadoop如何存储数据,采用的HDFS,hadoop distributed file system
- 计算:hadoop 采用mapreduce 模型来实现进行大数据的计算,来满足对数据的过滤帅选