一、了解分布式和集群
1.什么叫分布式,什么叫集群
1.1分布式
指多台服务器集中一起工作,每台服务器实现不同的功能,各司其职
1.2集群
指一组独立的计算机系统构成的一多处处理器系统,之间通过网络实现进程,使多台服务器在一起工作
1.3分布式和集群区别
分布式是多台机器将一件事件分解,每台机器做的任务不同
集群是事件分布在多台机器,一起完成
二、Hadoop基本框架
1.Hadoop分为几个基本部件
1.1HDFS组件
用于构建分布式文件系统便于数据储存(解决海量数据存储)
1.2MapReduce组件
提供编程接口用于用户开发分布式的计算程序(解决海量数据计算)
1.3YARN组件
用于用户整体调度集群的资源使用(解决资源任务调度)