1、目录介绍
|--bin
|--etc
|--lib
|--libexec
|--include
|--sbin
|--share
|--LICENSE.txt
|--NOTICE.txt
|--README.txt
- bin:存放对Hadoop相关服务(HDFS,YARN)进行操作的脚本
- etc:Hadoop的配置文件目录,存放Hadoop的配置文件
- lib:存放Hadoop的本地库(对数据进行压缩解压缩功能)
- libexec:同lib
- include:c语言头文件
- sbin:存放启动或停止Hadoop相关服务的脚本
- share:存放Hadoop的依赖jar包、文档、和官方案例
官方文档:https://hadoop.apache.org/docs/r2.10.0/
2、本地运行模式
2.1 grep示例
在hadoop目录下
mkdir input
cp -p etc/hadoop/*.xml input/
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.10.0.jar grep input/ output 'dfs[a-z.]+'