hadoop 操作（二）

最新推荐文章于 2024-05-10 05:28:28 发布

五道口纳什

最新推荐文章于 2024-05-10 05:28:28 发布

阅读量1k

点赞数

分类专栏： hadoop

本文链接：https://blog.csdn.net/lanchunhui/article/details/50835726

版权

hadoop 专栏收录该内容

45 篇文章 0 订阅

订阅专栏

hadoop 相关操作

在 Linux Shell 中操作 hadoop 文件系统（hdfs）

（1）查看（查看根目录 /）
```
[root@hadoop0 ~]# hadoop fs -ls /
[root@hadoop0 ~]# hadoop fs -ls hdfs://hadoop0:9000/
```
注：根目录：/，是对hdfs://hadoop0:9000的省略
（2）递归查询
```
[root@hadoop0 ~]# hadoop fs -lsr /
```

（3）上传文件

[root@hadoop0 ~]# hadoop fs -put 文件 路径

（4）查看文件

[root@hadoop0 ~]# hadoop fs -text 文件

（5）递归删除

[root@hadoop0 ~]# hadoop fs -rmr 文件夹

（6）创建文件夹

[root@hadoop0 ~]# hadoop fs -mkdir

创建多级目录

-mkdir -p /user/root/input

hadoop jar

[root@hadoop0 ~]# hadoop **.jar args[0] args[1]
				# 第一个参数即为 args[0]，而非agrs[1]

被打包的类文件（编译后的 .class 文件）需要 extends Configured implements Tool（覆盖run方法）。

public class MyClass extends Configured implements Tool{
	@override
	public int run(String[] args) throws Exception{
		
		...
		Job job = new Job(...);
		
		job.setJarClass(MyClass.class);
		...
		
		return 0;
	}
	public static void main(String[] args){
		ToolRunner.run(new MyClass(), args);
	}
}