Hadoop学习笔记_操作篇之一：HDFS操作

最新推荐文章于 2020-03-10 12:09:25 发布

放飞的心灵

最新推荐文章于 2020-03-10 12:09:25 发布

阅读量984

点赞数

分类专栏： Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/rumengjian/article/details/20545557

版权

Hadoop 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

1、查看版本

hadoop version

2、查看目录

hadoop fs -ls /

hadoop fs -ls /user/hadoop

3、创建目录

hadoop fs -mkdir /user/in

4、删除目录

hadoop dfs -rmr test

5、删除文件

hadoop fs -rm test.txt

6、上传文件到HDFS目录

haddop dfs -put *.txt test

7、下载文件

hadoop dfs -get test test1

8、查看文件内容

hadoop fs -text /user/hadoop/20120722/test1.txt

hadoop dfs –tail test

hadoop dfs –cat test

9、复制文件：

(1) 从本地到hdfs

hadoop fs -copyFromLocal /tmp/test.txt /user/in/test.txt

(2) 从hdfs到hdfs

hadoop fs -cp /hadoop/test.txt /user/in/test.txt

10、分布式复制(distcp)

(1) 说明：

dist分布式，cp复制

distcp操作会被解析为一个MapReduce操作来执行

(2) 用途：

用于在集群内部及集群之间复制数据

(3) 注意：

n 源路径必须是绝对路径

n 一般会跳过目标路径上已存在的文件，

n 可通过-overwirte可以选择对已存在的文件进行覆盖

n 通过-update可以对仅更新过的文件进行重写

(4) 用法：

n 要求集群版本一致

hadoop distcp hdfs://192.168.32.168/test hdfs://192.168.32.68/in

n 集群版本不一致

hadoop distcp hftp://192.168.32.168/test hdfs://192.168.32.68/in

11、移动文件

hadoop fs -mv /data/in/test.txt /data/ok.txt

12、执行jar文件

hadoop jar /tmp/testhdfs.jar test.my.CopyToHadoop

hadoop jar testhdfs.jar /user/hadoop/in/ncdc_all.txt /user/hadoop/output

13、使用hadoop归档文件(archive)

(1) 作用：

hadoop归档文件和HAR文件可以将文件高效的放入HDFS块中的文件存档设备，在减少NameNode内在使用的同时，仍然允许对文件进行透明访问。也就是hadoop归档文件可以作为MapReduce的输入。

(2) 用法

hadoop archive -archiveName 归档文件名　要归档的文件源（可有多个）HAR文件的输出目录

hadoop archive -archiveName test.har /data/test/ /data/in/

(3) 查看归档文件中的文件

hadoop fs -lsr har:///data/in/test.har

14、 hadoop中System.out.println输出

(1) 首先打开http://localhost:50030/jobtracker.jsp进入jobtracker，在Completed Jobs中选刚执行的job

(2) 再选对应的map或者reduce,进Task Logs下面的all，里面有stdout logs和stderr logs

15、 fsck工具:检查HDFS中文件的健康状况

hadoop fsck /

16、查找文件的所有块

hadoop fsck /data/in/hello.txt -files -blocks -racks

-files：显示文件的文件名、大小、块数量、及是否可用（是否存在丢失的块）

-blocks：显示每个块在文件中的信息，一个块用一行显示

-racks：显示每个块所在机架位置和datanode的位置

不加选项，则执行以上所有指令　＝　hadoop fsck /data/in/hello.txt

17、均衡器

start-balancer.sh

or

hadoop balancer

18、 secondarynamenode操作

(1) 运行DFS的secondarynamenode进程

hadoop secondarynamenode

(2) 启动检查secondarynamenode的checkpoint过程(editlog超过规定大小，默认为64MB)

hadoop secondarynamenode -checkpoint

(3) 强制启动checkpoint过程

hadoop secondarynamenode -checkpoint force

(4) 显示editlog文件大小

hadoop secondarynamenode -geteditsize

19、 NameNode操作

(1) 运行DFS的namenode进程

hadoop namenode

(2) 格式化DFS文件系统

hadoop namenode -format

(3) 升级hadoop后启动namenode

hadoop namenode -upgrade

(4) 回滚namenode到前一版本

hadoop namenode -rollback

(5) 删除文件系统的前一个状态(将会导致系统不能回到前一个状态)

hadoop namenode -finalize

(6) 复制备份checkpoint的状态到当前checkpoint

hadoop namenode -importcheckpoint

20、 datanode操作

(1) 运行DFS的datanode进程

hadoop datanode

(2) 回滚namenode到前一版本

hadoop datanode -rollback

21、验证Hadoop集群状态

hadoop dfsadmin -report

22、启动Hadoop和HBase

start-all.sh

start-hbase.sh

23、查看启动进程

jps

放飞的心灵

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

放飞的心灵 CSDN认证博客专家 CSDN认证企业博客

码龄21年

41: 原创

13万+: 周排名

209万+: 总排名

12万+: 访问

: 等级

1701: 积分

117: 粉丝

23: 获赞

4: 评论

116: 收藏

私信

关注

热门文章

分类专栏

Oracle 17篇
Linux 43篇
Java 2篇
MySQL 8篇
C#
C++ 1篇
Python 2篇
Android 1篇
Hadoop 6篇
杂谈 1篇

最新评论

Deepin Linux相关操作
CSDN-Ada助手: 非常感谢CSDN博主分享的“Deepin Linux相关操作”博客，我觉得内容非常有价值，可以帮助其他用户更好地使用Deepin Linux系统。建议下一篇博客可以继续探讨Deepin Linux的应用场景和优势，或者分享一些在Deepin Linux上的高效工作技巧和实用工具。相信这样的技术文章对其他用户会非常有帮助，期待你的下一篇博客！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
Linux运维学习笔记之二：常用命令
Tisfy: 文笔流畅，修辞得体，深得魏晋诸朝遗风
Linux运维学习笔记之一：运维的原则和学习方法
Brand new day: 第十二条见参考博文注20在哪呀，没有找到
Linux运维学习笔记之一：运维的原则和学习方法
胡泽宽: 来学习一下
给IT新人的15点建议：苦逼程序员的辛酸反省与总结
llyandong: 博主所言极是，目前为止，我在我这个公司实习加工作差不多一年了，博主提到的东西，大多都有一定的体会和认识，再之后的工作中一定要更进一步的注意这些东西。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。