hdfs命令学习

最新推荐文章于 2024-01-04 13:59:13 发布

caixiaowang

最新推荐文章于 2024-01-04 13:59:13 发布

阅读量251

点赞数 1

分类专栏： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/caixiaowang/article/details/79681480

版权

hadoop 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

把一个本地文件上传到hdfs

hdfs dfs -put a.txt b.txt

a.txt在本地，b.txt是要传到的hdfs路径。

从hdfs导出文件到本地

hdfs dfs -get wordcountout/part-0000* /tmp/output

Hdfs的shell脚本

hdfs提供了很多shell命令来实现访问文件系统的功能，hadoop自带的shell脚本叫hadoop。如果需要获取文件系统的所有命令，可以通过hadoop fs。

hadoop fs

help

使用help选项可以获得对某个具体命令的详细说明

hadoop fs -help ls

创建文件夹

hadoop fs -mkdir -p /data/weblogs

本地文件拷贝到hdfs

hadoop fs -copyFromLocal weblog_entries.txt /data/weblogs

列出文件的信息

hadoop fs -ls /data/weblogs/weblog_entries.txt

集群间数据复制

通过distcp实现hadoop集群间复制大量数据。
distcp是通过启动mapreduce实现数据复制的。
使用distcp，需要关闭源集群map任务的推测机制，在mapred-site.xml中将mapred.map.tasks.speculative.execution的值设为false，避免在map任务失败时产生不可知的行为。

将集群a的weblogs文件夹复制到集群b上

hadoop distcp hdfs://namenodeA/data/weblogs hdfs://namenodeB/data/weblogs

将集群a的weblogs文件夹复制到集群b并覆盖已存在的文件

hadoop distcp -overwrite hdfs://namenodeA/data/weblogs hdfs://namenodeB/ data/weblogs

同步集群a和集群b之间的weblogs文件夹

hadoop distcp -update hdfs://namenodeA/data/weblogs hdfs://namenodeB/data/  weblogs

原理
在源集群，待复制的文件夹的内容会被复制为一个临时的大文件。并且会启动一个只有map的mapreduce作业。每个map会被分配256M的分文件。
比如，如果weblogs文件夹总大小为10g，那么会启动40个map，每个map复制256M数据。
也可以通过参数设置启动的map数量。

hadoop distcp -m 10 hdfs://namenodeA/data/weblogs hdfs://namenodeB/data/ weblogs

这里，启动10个map，如果weblogs一共10G，那么每个map复制1G。

递归查看一个文件夹

hadoop fs -lsr /data/weblogs/import

拷贝文件

hadoop fs -cp src dst

移动文件

hadoop fs -mv src dst

查看文件内容

hadoop fs -cat /user/hadoop/a.txt

删除文件

hadoop fs -rm /user/hadoop/a.txt

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

caixiaowang CSDN认证博客专家 CSDN认证企业博客

码龄7年

16: 原创

42万+: 周排名

213万+: 总排名

3万+: 访问

: 等级

468: 积分

7: 粉丝

16: 获赞

11: 评论

22: 收藏

私信

关注

热门文章

分类专栏

android 5篇
数据库 2篇
sqlite 1篇
数据库升级 1篇
sqliteopenhelper 1篇
webview 1篇
跨域 1篇
cookie 1篇
nodejs
javascript 1篇
java 1篇
hadoop 5篇
linux 1篇
mysql 1篇
数学 1篇

最新评论

使用SQLiteOpenHelper的正确姿势
王者成杰: 谢谢，大佬！
详谈java内存模型
lei_1000: 请问如下的内存屏障是Java编译器自动加上的，能体现在字节码中吗？还是这段代码有什么特别之处，才会加上。不是很理解为什么不允许load load的重排，感觉他们都是只读操作，先后顺序也不会影响单线程下的执行的结果啊。 [code=java] System.out.print(a); /** load-load barrier **/ System.out.print(b); [/code]
详谈java内存模型
caixiaowang 回复花溪的小石头: 确实没有原子性呀~原文是“但这并不意味着，volatile具有原子性”。。。意思就是不具有啊
详谈java内存模型
花溪的小石头: "volatile具有原子性" 这句话有明显错误 volatitle只具有可见性，而不具有原子性，所以使用volatitle关键字时，尽量只有一个线程完成写操作，多个线程进行读操作。
android线程间通信之handler
吴庆森: 举个小小栗子更好

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。