大数据处理实验(三)HDFS基本操作实验


HDFS的基本命令格式:hdfs dfs -cmd <args>
注意:需要事先将HADOOP_HOME/bin目录配置进入环境变量。

1、Hadoop配置环境变量

进入实验二创建的master容器

sudo docker start master
sudo docker exec -it master /bin/bash

参考文章:Hadoop配置环境变量
https://blog.csdn.net/sinat_38079265/article/details/108599800

进入hadoop安装目录

cd /usr/local/hadoop-3.2.1

进入文件

vi /etc/profile

配置环境变量

export HADOOP_HOME=/usr/local/hadoop-3.2.1
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

第一行的的HADOOP_HOME是你的hadoop安装的位置。
在这里插入图片描述

保存环境变量

source /etc/profile

在这里插入图片描述按照实验一步骤启动hadoop
在这里插入图片描述

2、列出当前目录下的文件

hdfs dfs -ls

在HDFS创建文件夹:hdfs dfs -mkdir <文件夹名称>

3、级联创建一个文件夹,类似这样一个目录:/mybook/input

hdfs dfs -mkdir -p <文件夹名称>

在这里插入图片描述

4、上传文件至HDFS

hdfs dfs -put <源路径> <目标存放路径>

在这里插入图片描述在这里插入图片描述

5、从HDFS上下载文件

hdfs dfs -get <HDFS文件路径> <本地存放路径>

在这里插入图片描述

6、查看HDFS上某个文件的内容

hdfs dfs -text <HDFS上的文件存放路径>

hdfs dfs -cat <HDFS上的文件存放路径>

在这里插入图片描述

6、统计目录下各文件的大小(单位:字节B)

hdfs dfs -du <目录路径>

在这里插入图片描述

7、删除HDFS上某个文件或者文件夹

hdfs dfs -rm <文件>

hdfs dfs -rm -r <文件夹>

在这里插入图片描述

在这里插入图片描述

8、使用help命令寻求帮助

hdfs dfs -help <命令>

在这里插入图片描述

  • 7
    点赞
  • 39
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
完整全套资源下载地址:https://download.csdn.net/download/qq_27595745/63399560 【完整课程列表】 Hadoop实验操作手册-1 共20页.pdf Hadoop实验操作手册-2 共73页.pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 1-大数据处理平台与技术概述(共63页).pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 2-HDFS-大数据文件系统(共45页).pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 3-MapReduce—并行计算(共69页).pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 4-HBase—Hadoop数据库(共55页).pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 5-Hive—数据仓库(共51页).pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 6-Mahout --- 大数据挖掘技术(共38页).pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 7- Hadoop其他生态系统(共29页).pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 8-大数据案例(共49页).pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 9- 大数据最新进展(共32页).pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 10-大数据课程总结(共9页).pdf
【完整课程列表】 Hadoop实验操作手册-1 共20页.pdf Hadoop实验操作手册-2 共73页.pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 10-大数据课程总结(共9页).pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 1-大数据处理平台与技术概述(共63页).pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 2-HDFS-大数据文件系统(共45页).pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 3-MapReduce—并行计算(共69页).pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 4-HBase—Hadoop数据库(共55页).pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 5-Hive—数据仓库(共51页).pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 6-Mahout --- 大数据挖掘技术(共38页).pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 7- Hadoop其他生态系统(共29页).pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 8-大数据案例(共49页).pdf 完整版 上海财经大学MEM课程 大数据与云计算技术教程 大数据处理平台和技术 9- 大数据最新进展(共32页).pdf
HDFSHadoop分布式文件系统)是Hadoop框架中的分布式文件系统,用于存储和管理大规模数据集。在实验1中,我们将学习如何使用HDFS进行一些常见的操作。 首先,我们需要启动HDFS。通过运行`start-dfs.sh`命令来启动HDFS的所有组件,包括NameNode(负责管理文件系统的命名空间)和DataNode(存储实际的数据块)。 接下来,我们要创建并上传文件到HDFS。使用`hdfs dfs -mkdir`命令创建一个新的目录,例如`hdfs dfs -mkdir /user/input/`。然后,使用`hdfs dfs -put`命令将本地文件上传到HDFS中的目录中,例如`hdfs dfs -put input.txt /user/input/`。 在HDFS中,我们可以使用`hdfs dfs -ls`命令列出文件和目录的内容。例如,`hdfs dfs -ls /user/input/`将显示该目录下的所有文件和子目录。 如果我们想要从HDFS下载文件到本地文件系统,可以使用`hdfs dfs -get`命令。例如,`hdfs dfs -get /user/input/input.txt`将从HDFS中下载文件到当前工作目录。 除了上传和下载文件,我们还可以使用`hdfs dfs -cat`命令在终端查看文件的内容。例如,`hdfs dfs -cat /user/input/input.txt`将在终端上显示文件的内容。 最后,当我们不再需要某个文件或目录时,可以使用`hdfs dfs -rm`命令从HDFS中删除它们。例如,`hdfs dfs -rm /user/input/input.txt`将删除HDFS中的文件。 总结来说,这个实验教会我们如何使用HDFS进行文件和目录的创建、上传、下载和删除操作。这些基本操作是我们在使用Hadoop进行大规模数据处理时的基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值