hadoop从零开始--HDFS篇

本文详细介绍了Hadoop的分布式文件系统HDFS,包括其基本概念、shell操作、dfsadmin命令、httpFS访问方式、工作流程、数据存储解析及解决小文件问题的方法。适合Hadoop初学者入门。
摘要由CSDN通过智能技术生成

一、HDFS体系结构与基本概念

珍惜生命,拒绝废话!
一句话概括:HDFS是distributed file system的简写,是众多分布式文件管理系统中的一种,不适合小文件,重要的事情再说一遍,不适合小文件。
结构图

二、HDFS的shell操作
这里总结大部分常用命令,不再过多解释,建议有linux基础的情况下学习。
1、基础命令
hdfs dfs -ls / 查看HDFS根目录
hdfs dfs -mkdir /test 在根目录创建一个目录test
hdfs dfs -mkdir /test1 在根目录创建一个目录test1
echo -e ‘hadoop second lesson’ >test.txt
hdfs dfs -put ./test.txt /test 或
hdfs dfs -copyFromLocal ./test.txt /test
hdfs dfs -get /test/test.txt
hdfs dfs -getToLocal /test/test.txt
hdfs dfs -cp /test/test.txt /test1
hdfs dfs -rm /test1/test.txt
hdfs dfs -mv /test/test.txt /test1
hdfs dfs -rmr /test1
hdfs dfs -appendToFile

2、dfsadmin命令

配额 bin/hdfs dfsadmin -setQuota 10 lisi
-clrQuota 清空
bin/hdfs dfsadmin -setSpaceQuota 4k /lisi/
-clrSpaceQuota 清空

查看 bin/hdfs dfs -count -q -h /lisi

进出安全模式 bin/hdfs dfsadmin -safemode enter/leave

hadoop在启动的时候会默认进入安全模式,不过不用担心,30秒后自动退出安全模式。

3、httpFS访问
很多人认为httpFS访问不重要,其实不然,前面的shell命令必须要在hadoop环境下才能执行,而httpFS命令却可以摆脱这种限制,重要性不再多说。

编辑文件:httpfs-env.sh
编辑文件:core-site.xml

hadoop.proxyuser.root.hosts

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值