HDFS分布式文件系统

本文介绍了如何通过HDFS的Shell命令和JavaAPI进行文件操作,包括创建目录、上传文件、查看内容、检查安全模式以及使用API进行文件复制。实验内容涉及创建目录、上传个人文件和使用编程代码下载文件至本地。
摘要由CSDN通过智能技术生成

一、实验目的及要求

1、掌握常用的HDFS的Shell命令

2、掌握Java API实现HDFS文件系统的操作

二、实验原理与内容

1.在HDFS创建目录  /mytestdir/ch04

2.在本地文件系统创建文件,文件名为自己名字拼音全拼,使用put命令将该文件上传到HDFS的/mytestdir/ch04中

3.使用 cat命令查看刚刚上传的文件内容

4.查看集群的安全模式

5.在本地文件系统创建文件,文件名为自己学号,使用API方式上传该文件到/mytestdir中,并将其下载到本地/home/hadoop下。(给出编程代码,及hdfs文件截图)

三、实验软硬件环境

Hadoop集群

四、实验过程(实验步骤、记录、数据、分析)

注:分别列出题目,给出相应命令语句,以及结果截图

  1. 在HDFS创建目录  /mytestdir/ch04 

命令语句:hadoop fs -mkdir -p /mytestdir/ch04

2.在本地文件系统创建文件,文件名为自己名字拼音全拼,使用put命令将该文件上传到HDFS的/mytestdir/ch04中

      命令语句:touch Liangyanxing.txt(上传文件前,可以用vi Liangyanxing.txt命令,在文件里面写东西,要不然上传的是一个空的txt文件)

     hadoop fs -put Liangyanxing.txt /mytestdir/ch04


3.使用 cat命令查看刚刚上传的文件内容

命令语句:hadoop fs -cat /mytestdir/ch04/Liangyanxing.txt

4.查看集群的安全模式

      命令语句:hadoop dfsadmin -safemode get(有Safe mode is OFF 就是正确的了)

5.在本地文件系统创建文件,文件名为自己学号,使用API方式上传该文件到/mytestdir中,并将其下载到本地/home/hadoop下。(给出编程代码,及hdfs文件截图)

编程代码:

package test;

import java.io.IOException;

import java.net.URI;

import java.net.URISyntaxException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

public class File {

    public static void main(String[] agrs) throws Exception{

     testCopyFromLocalFile();

     downloadFile2();

    }

    public static void testCopyFromLocalFile() throws Exception{

        Configuration conf = new Configuration();

        FileSystem fs = FileSystem.get(new URI("hdfs://localhost:9000"), conf,"lyx");

        fs.copyFromLocalFile(new Path("/home/lyx/bigdata/202108764225.txt"),new Path("/mytestdir"));

        fs.close();

    }

       (path里面的路径要根据自己起的路径,删除运行)

    public static void downloadFile2() throws URISyntaxException, IOException, InterruptedException {

       FileSystem fileSystem = FileSystem.get(new URI("hdfs://localhost:9000"), new Configuration(),"lyx");

       fileSystem.copyToLocalFile(new Path("/mytestdir"), new Path("/home/hadoop"));

        fileSystem.close();

    }

}

hdfs文件截图:

运行eclipse-4.7.0-linux.gtk.x86_64.gz的注意事项:

项目文件右键-->Build Path-->Configure Build Path:

然后进入下面页面-->

选择红圈部分-->

分别进入这五个文件夹,将jre文件和lib文件夹里面的jar文件都添加到eclipse里面(这部分步骤重复多,慢慢来),添加完成后就可以运行代码了。

(全选,按着ctrl,一个一个选择)

  • 19
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值