[整理学习]Hadoop基本文件操作命令

最新推荐文章于 2024-04-14 00:11:56 发布

Gloria_bing

最新推荐文章于 2024-04-14 00:11:56 发布

阅读量1.3k

点赞数

分类专栏：学习笔记 hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gloria__zhang/article/details/9197529

版权

学习笔记同时被 2 个专栏收录

23 篇文章 0 订阅

订阅专栏

6 篇文章 0 订阅

订阅专栏

假设Hadoop的安装目录HADOOP_HOME为/home/hadoop

启动与关闭

启动HADOOP

1. 进入HADOOP_HOME目录。

2. 执行sh bin/start-all.sh

关闭HADOOP

1. 进入HADOOP_HOME目录。

2. 执行sh bin/stop-all.sh

文件操作

Hadoop使用的是HDFS，能够实现的功能和我们使用的磁盘系统类似。并且支持通配符，如*。

查看文件列表

查看hdfs中/user/admin/aaron目录下的文件。

1. 进入HADOOP_HOME目录。

2. 执行sh bin/hadoop fs -ls /user/admin/aaron

这样，我们就找到了hdfs中/user/admin/aaron目录下的文件了。

我们也可以列出hdfs中/user/admin/aaron目录下的所有文件（包括子目录下的文件）。

1. 进入HADOOP_HOME目录。

2. 执行sh bin/hadoop fs -lsr /user/admin/aaron

文件操作

1.将本地文件拷贝到 hdfs 文件系统中
bin/hadoop fs -copyFromLocal /server/bin/nutch/urls/url.txt urls
2.将hdfs中的文件拷贝到本地路径

bin/hadoop fs -copyToLocal urls(hdfs文件) /opt/index (本地路径)
3.查看hdfs文件系统内文件列表

bin/hadoop dfs -ls
4.删除hdfs文件系统中的文件

bin/hadoop dfs -rmr urls
5.进入hdfs 目录

bin/hadoop fs -ls /user/admin/aaron 6. 创建目录

bin/hadoop fs -mkdir /user/suse/newDir
7.删除文件

bin/hadoop fs -rm /user/suse/crawl/needDelete
8.删除目录下所有文件

bin/hadoop fs -rmr /user/suse/
9.查看文件内容

bin/hadoop fs –cat /user/suse/newFile

MAPREDUCE JOB操作

提交MAPREDUCE JOB

原则上说，Hadoop所有的MapReduce Job都是一个jar包。

运行一个/home/admin/hadoop/job.jar的MapReduce Job

1. 进入HADOOP_HOME目录。

2. 执行sh bin/hadoop jar /home/admin/hadoop/job.jar [jobMainClass] [jobArgs]

杀死某个正在运行的JOB

假设Job_Id为：job_201005310937_0053

1. 进入HADOOP_HOME目录。

2. 执行sh bin/hadoop job -kill job_201005310937_0053

更多HADOOP的命令

上面介绍的这些Hadoop的操作命令是我们最常用的。如果你希望了解更多，可以按照如下的方式获取命令的说明信息。

1. 进入HADOOP_HOME目录。

2. 执行sh bin/hadoop

我们可以看到更多命令的说明信息：

Usage: hadoop [--config confdir] COMMAND

where COMMAND is one of:

namenode -format format the DFS filesystem

secondarynamenode run the DFS secondary namenode

namenode run the DFS namenode

datanode run a DFS datanode

dfsadmin run a DFS admin client

fsck run a DFS filesystem checking utility

fs run a generic filesystem user client

balancer run a cluster balancing utility

jobtracker run the MapReduce job Tracker node

pipes run a Pipes job

tasktracker run a MapReduce task Tracker node

job manipulate MapReduce jobs

queue get information regarding JobQueues

version print the version

jar <jar> run a jar file

distcp <srcurl> <desturl> copy file or directories recursively

archive -archiveName NAME <src>* <dest> create a hadoop archive

daemonlog get/set the log level for each daemon

or

CLASSNAME run the class named CLASSNAME

Most commands print help when invoked w/o parameters.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。