Hadoop目录介绍与本地运行模式

本文介绍了Hadoop的目录结构,包括bin、etc、lib等目录的作用,并通过grep和wordcount示例详细阐述了Hadoop的本地运行模式。
摘要由CSDN通过智能技术生成

1、目录介绍

|--bin
|--etc
|--lib
|--libexec
|--include
|--sbin
|--share
|--LICENSE.txt
|--NOTICE.txt
|--README.txt
  • bin:存放对Hadoop相关服务(HDFS,YARN)进行操作的脚本
  • etc:Hadoop的配置文件目录,存放Hadoop的配置文件
  • lib:存放Hadoop的本地库(对数据进行压缩解压缩功能)
  • libexec:同lib
  • include:c语言头文件
  • sbin:存放启动或停止Hadoop相关服务的脚本
  • share:存放Hadoop的依赖jar包、文档、和官方案例

官方文档:https://hadoop.apache.org/docs/r2.10.0/

2、本地运行模式

2.1 grep示例

在hadoop目录下

mkdir input
cp -p etc/hadoop/*.xml input/
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.10.0.jar grep input/ output 'dfs[a-z.]+'
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值