Hadoop是在分布式服务器集群上存储海量数据并运行分布式分析应用的一个平台,其核心部件是HDFS与MapReduce。HDFS是一个分布式文件系统,可对数据系统进行分布式储存读取;MapReduce是一个计算框架,通过对计算任务的拆分,再根据任务调度器,对任务进行分布式计算。
Hadoop是大数据开发必不可少的框架技术,因此,想要学好大数据,必须要掌握Hadoop相关知识,那么,hadoop主要学什么呢?
一、Hadoop环境搭建
1. Hadoop生态环境介绍
2. Hadoop云计算中的位置和关系
3. 国内外Hadoop应用案例介绍
4. Hadoop概念、版本、历史
5. Hadoop核心组成介绍及hdfs、mapreduce体系结构
6. Hadoop独立模式安装和测试
7. Hadoop的集群结构
8. Hadoop伪分布的详细安装步骤
9. 通过命令行和浏览器观察Hadoop
10. Hadoop启动脚本分析