hadoop概念
hadoop
What is Apache Hadoop?
The Apache Hadoop project develops open-source software for reliable,scalable,distributed computing。
是一个生态系统
单机多线程
多机多线程(网络通信) 开发难度大 自己写的sql在多个机器上去执行(这个分布式程序开发难度很大)
海量数据的存储(HDFS) Hadoop Distributed file System
海量数据的分析(Mapreduce)
资源管理调度(YARN)Yet Another Resource Negotiator:另一种资源协调者(jar包分发,CPU和内存的分配)是一种新的Hadoop资源管理器