hadoop的HDFS操作

最新推荐文章于 2023-04-23 14:20:18 发布

风行者之倾覆天下

最新推荐文章于 2023-04-23 14:20:18 发布

阅读量758

点赞数

分类专栏：工具 HDFS

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/haramshen/article/details/52597702

版权

工具同时被 2 个专栏收录

13 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

1.进入服务器

ssh -p 2208 haram.shen@x.x.x.x

（一些操作可以参见下python的mapreduce的那个项目）

2.删除hadoop文件

hadoop dfs -rm -r -f /tmp/hx

3.输出固定行：

hadoop dfs -cat /tmp/hxs/out.txt | head -n 100;

4.建立文件夹

hadoop dfs -mkdir /tmp/hx

4.1:把HDFS的文件合并

hadoop fs -text /tmp/hxsout_3/part* | hadoop fs -put -f - /tmp/hs/out.txt;

4.2把hive数据传到HDFS文件

hive -e "select id,user_id,rating from rec.rec_pref_cf" | hadoop dfs -put -f - /tmp/hs/Item_user_score.txt;

4.2传本地文件到HDFS上

hadoop dfs -copyFromLocal /home/haram.shen/cf/colfilter.txt /tmp/hx

4.3 把HDFS文件拉到本地服务器

hadoop fs -get input1.txt /home/haram.shen/input1.txt

5=============hadoop=================

1.ps -ef | grep in.telnetd

表示全局正则表达式版本

2.在’/usr/src/Linux/Doc’目录下搜索带字符串’magic’的文件：

$ grep magic /usr/src/Linux/Doc/*

3.用管道来一行行排除的，就是

cat xxx | grep xxx | grep xxx | grep xxx

4.hadoop dfs -getmerge /tmp/hxsout/part-00000.snappy /home/haram.shen/tt.txt

hdfs集群上有一个/user/hadoop/output目录里面有作业执行的结果（多个文件组成）part-000000,part-000001,part-000002然后你想把所有的文件合拢来一起看

5.查看snappy压缩

hadoop dfs -text /tmp/hxsout/part-00000.snappy | less

=======================================================

5.1 查看 Job 信息：

hadoop job -list

5.2 杀掉 Job：

hadoop job –kill job_id

5.3 指定路径下查看历史日志汇总：

hadoop job -history output-dir

5.4 作业的更多细节：

hadoop job -history all output-dir

5.5 打印map和reduce完成百分比和所有计数器：

hadoop job –status job_id

5.6 杀死任务。被杀死的任务不会不利于失败尝试：

hadoop jab -kill-task <task-id>

5.7 使任务失败。被失败的任务会对失败尝试不利：

hadoop job -fail-task <task-id>

风行者之倾覆天下

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
hadoop的HDFS操作

1.进入服务器ssh -p 2208 haram.shen@x.x.x.x（一些操作可以参见下python的mapreduce的那个项目）2.删除hadoop文件hadoop dfs -rm -r -f /tmp/hx3.输出固定行：hadoop dfs -cat /tmp/hxs/out.txt | head -n 10
复制链接

扫一扫

专栏目录

风行者之倾覆天下 CSDN认证博客专家 CSDN认证企业博客

码龄9年

23: 原创

106万+: 周排名

206万+: 总排名

11万+: 访问

: 等级

921: 积分

10: 粉丝

16: 获赞

2: 评论

39: 收藏

私信

关注

热门文章

分类专栏

数据挖掘 3篇
NLP
语义分析
语言编辑器 1篇
工具 13篇
Scala 4篇
hive 4篇
yu
推荐系统 2篇
HDFS 2篇
Maven 2篇
hadoop 2篇
MapReduce 2篇
Linux 1篇
java 2篇
python 1篇
Spark 1篇
强化学习

最新评论

构建Scala的Maven项目
CSDN-Ada助手: 非常感谢CSDN博主分享的《构建Scala的Maven项目》博客，对于想要学习Scala的开发者来说，这篇文章非常有价值。我认为接下来可以继续写一篇关于如何使用Scala进行数据分析的技术文章，这样的主题对其他用户也非常有帮助，相信会有更多读者受益于你的分享。期待你的下一篇文章！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
hive的统计函数
summer_story: 太棒了，不用自己写了。。。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。