Hadoop学习总结(使用Java API操作HDFS)_java 操作hadoop hdfs

rename("/aa","/aa2");  //重命名文件夹

## 七、删除文件


![](https://img-blog.csdnimg.cn/f4ab0f4acaf6423ba7c45a7b45bf8ff5.png)



// 删除文件 ,如果是非空文件夹,参数2必须给值true
public static void delete(String path_str) throws IOException {
    //ture表示递归删除 可以用来删除目录 rm -rf
    //false表示非递归删除
    fs.delete(new Path(path_str),true);
    // 关闭资源
    fs.close();
    System.out.println("删除文件夹成功");
}


    //main()方法中调用
    delete("/aa2");  //删除文件

## 八、查看文件信息


### 1、查看文件信息



// 查看文件信息
public static void  listFiles(String path_str) throws IOException {
    //获取迭代器对象
    RemoteIterator<LocatedFileStatus> listFiles = fs.listFiles(new Path(path_str),true);
    //遍历
    while (listFiles.hasNext()){
        LocatedFileStatus fileStatus = listFiles.next();
        //打印当前文件名
        System.out.println(fileStatus.getPath().getName());
        //打印当前文件块大小
        System.out.println(fileStatus.getBlockLocations());
        //打印当前文件权限
        System.out.println(fileStatus.getPermission());
        //打印当前文件内容长度
        System.out.println(fileStatus.getLen());
        //获取该文件块信息(包含长度、数据块、datanode的信息)

// BlockLocation[] blockLocations = fileStatus.getBlockLocations();
// for (BlockLocation bl : blockLocations){
// System.out.println(“block-length:” + bl.getLength()+“–”+“block-offset:”+bl.getOffset());
// String[] hosts = bl.getHosts();
// for (String host : hosts){
// System.out.println(host);
// }
// }
}
System.out.println(“--------分割线---------”);
fs.close();
}



    //main()方法中调用
    listFiles("/data.txt");  //查看文件信息


### 2、统计目录下所有文件(包括子目录)


![](https://img-blog.csdnimg.cn/b2431a9cfba749dcaa40c651f1539ac8.png)



// 1、统计目录下所有文件(包括子目录)
// 1、统计某个路径(由main方法决定哪个路径),下所有的文件数里,例如:输出:该路径下共有 3 个文件
public static void count(String path_str) throws IOException {
    //获取迭代器对象
    RemoteIterator<LocatedFileStatus> listFiles = fs.listFiles(new Path(path_str),true);
    //遍历
    int count = 0;
    while (listFiles.hasNext()) {
        LocatedFileStatus fileStatus = listFiles.next();
        count++;
    }
    System.out.println("路径:【"+ path_str +"】下,文件数量为"+count);
    fs.close();
}


    //main()方法中调用
    count("/");  //统计

###  3、列出某个路径下所有的文件数里


![](https://img-blog.csdnimg.cn/a19e202c820043bca20fe227420dc0b6.png)



// 2、列出某个路径(由main方法决定哪个路径),下所有的文件数里,例如:文件1,文"路径:【"+ path_str +"】下,文件有:"+件2,....
public static void fileList(String path_str) throws IOException {
    //获取迭代器对象
    RemoteIterator<LocatedFileStatus> listFiles = fs.listFiles(new Path(path_str),true);
    String res = "";
    //遍历
    while (listFiles.hasNext()) {
        LocatedFileStatus fileStatus = listFiles.next();
        res += fileStatus.getPath().getName() + ", ";
    }
    if (res.equals("")){
        res = "没有文件";
    }else {
        res = res.substring(0,res.length() - 2);
    }
    System.out.println("路径:【"+ path_str +"】下的文件:" + res);

// fs.close();
}



    //main()方法中调用
      fileList("/"); //查看有什么文件
      fileList("/input"); //查看有什么文件

### 4、查看所有文件



/* 路径【/】下共有 7 子文件
文件数量:1,文件列表:data.txt
目录数量:6,文件列表:a, exp, input, output, test, tmp*/
public static void list(String path) throws IOException {
FileStatus[] fileStatuses = fs.listStatus(new Path(path));
String res = “路径【” + path + “】下共有 " + fileStatuses.length + " 子文件”;
int file_num = 0;
String file_list = “”;
int dir_num = 0;
String dir_list = “”;
for (FileStatus fileStatus:fileStatuses){
if (fileStatus.isFile()){
file_num ++;
file_list += fileStatus.getPath().getName() + ", ";
}else {
dir_num ++;
dir_list += fileStatus.getPath().getName() + ", ";
}
}
if (file_num != 0) res += “\n\t文件数量:” + file_num + “,文件列表:” + file_list.substring(0,file_list.length()-2);
if (dir_num != 0) res += “\n\t目录数量:” + dir_num + “,文件列表:” + dir_list.substring(0,dir_list.length()-2);
System.out.println(res);
}



    //main()方法中调用
    list("/"); //查看所有

### 5、判断是文件还是目录


![](https://img-blog.csdnimg.cn/de91887c18f84e6699532617876f96b7.png)



// 检查路径是目录还是文件
public static void mulu(String path_str) throws IOException {
    Path path = new Path(path_str);
    // 判断路径是否存在
    if (fs.exists(path)) {
        // 获取指定路径的详细信息
        FileStatus status = fs.getFileStatus(path);
        if (status.isDirectory()) {
            System.out.println(path + "这是一个目录");
        } else if (status.isFile()) {
            System.out.println(path + "这是一个文件");
        } else {
            System.out.println("这是一个未知类型");
        }
    } else {
        System.out.println("路径不存在");
    }
    //关闭资源
    fs.close();
}


    //main()方法中调用
    mulu("/exp/word.txt"); //检查路径是目录还是文件

## 九、源代码



package com.itcast.hdfsdemo;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.*;
import org.apache.hadoop.yarn.webapp.hamlet.Hamlet;
import sun.tracing.dtrace.DTraceProviderFactory;

import java.io.IOException;
import java.util.Arrays;

public class HDFS_CRUD {

static FileSystem fs = null;

// 完成上传功能
public static void upload(String path_str,String path_str1) throws IOException {
    //上传文件到HDFS
    //path_str本地文件路径  path_str1是上传到HDFS文件路径
    fs.copyFromLocalFile(new Path(path_str),new Path(path_str1));
    // 关闭资源
    fs.close();
    System.out.println("文件上传成功");
}

// 完成下载文件
public static void downloal(String path_str,String path_str1) throws IOException {
    //从 HDFS 下载文件到本地
    //path_str是HDFS文件路径  path_str1本地文件路径
    fs.copyToLocalFile(new Path(path_str),new Path(path_str1));
    // 关闭资源
    fs.close();
    System.out.println("文件下载成功");
}

// 创建目录
public static void mkdir(String path_str) throws IOException {
    //path_str所要创建目录路径
    fs.mkdirs(new Path(path_str));
    // 关闭资源
    fs.close();
    System.out.println("创建目录成功");
}

// 重命名文件夹
public static void rename(String old_name,String new_path) throws IOException {
    //old_name原文件名路径  //new_path新文件名路径
    fs.rename(new Path(old_name),new Path(new_path));
    // 关闭资源
    fs.close();
    System.out.println("重命名文件夹成功");
}
//main()方法中调用

// rename(“/aa”,“/aa2”); //重命名文件夹

// 删除文件 ,如果是非空文件夹,参数2必须给值true
public static void delete(String path_str) throws IOException {
    //ture表示递归删除 可以用来删除目录 rm -rf
    //false表示非递归删除
    fs.delete(new Path(path_str),true);
    // 关闭资源
    fs.close();
    System.out.println("删除文件夹成功");
}

// 查看文件信息
public static void  listFiles(String path_str) throws IOException {
    //获取迭代器对象
    RemoteIterator<LocatedFileStatus> listFiles = fs.listFiles(new Path(path_str),true);
    //遍历
    while (listFiles.hasNext()){
        LocatedFileStatus fileStatus = listFiles.next();
        //打印当前文件名
        System.out.println(fileStatus.getPath().getName());
        //打印当前文件块大小
        System.out.println(fileStatus.getBlockLocations());
        //打印当前文件权限
        System.out.println(fileStatus.getPermission());
        //打印当前文件内容长度
        System.out.println(fileStatus.getLen());
        //获取该文件块信息(包含长度、数据块、datanode的信息)

// BlockLocation[] blockLocations = fileStatus.getBlockLocations();
// for (BlockLocation bl : blockLocations){
// System.out.println(“block-length:” + bl.getLength()+“–”+“block-offset:”+bl.getOffset());
// String[] hosts = bl.getHosts();
// for (String host : hosts){
// System.out.println(host);
// }
// }
}
System.out.println(“--------分割线---------”);
fs.close();
}
//把查看文件信息分解为下面几个方法
// 1、统计目录下所有文件(包括子目录)
// 1、统计某个路径(由main方法决定哪个路径),下所有的文件数里,例如:输出:该路径下共有 3 个文件
public static void count(String path_str) throws IOException {
//获取迭代器对象
RemoteIterator listFiles = fs.listFiles(new Path(path_str),true);
//遍历
int count = 0;
while (listFiles.hasNext()) {
LocatedFileStatus fileStatus = listFiles.next();
count++;
}
System.out.println(“路径:【”+ path_str +“】下,文件数量为”+count);
fs.close();
}

// 2、列出某个路径(由main方法决定哪个路径),下所有的文件数里,例如:文件1,文"路径:【"+ path_str +"】下,文件有:"+件2,....
public static void fileList(String path_str) throws IOException {
    //获取迭代器对象
    RemoteIterator<LocatedFileStatus> listFiles = fs.listFiles(new Path(path_str),true);
    String res = "";
    //遍历
    while (listFiles.hasNext()) {
        LocatedFileStatus fileStatus = listFiles.next();
        res += fileStatus.getPath().getName() + ", ";
    }
    if (res.equals("")){
        res = "没有文件";
    }else {
        res = res.substring(0,res.length() - 2);
    }
    System.out.println("路径:【"+ path_str +"】下的文件:" + res);

// fs.close();
}

/* 路径【/】下共有 7 子文件
文件数量:1,文件列表:data.txt
目录数量:6,文件列表:a, exp, input, output, test, tmp*/
public static void list(String path) throws IOException {
FileStatus[] fileStatuses = fs.listStatus(new Path(path));
String res = “路径【” + path + “】下共有 " + fileStatuses.length + " 子文件”;
int file_num = 0;
String file_list = “”;
int dir_num = 0;
String dir_list = “”;
for (FileStatus fileStatus:fileStatuses){
if (fileStatus.isFile()){
file_num ++;
file_list += fileStatus.getPath().getName() + ", ";
}else {
dir_num ++;
dir_list += fileStatus.getPath().getName() + ", ";
}
}
if (file_num != 0) res += “\n\t文件数量:” + file_num + “,文件列表:” + file_list.substring(0,file_list.length()-2);
if (dir_num != 0) res += “\n\t目录数量:” + dir_num + “,文件列表:” + dir_list.substring(0,dir_list.length()-2);
System.out.println(res);
}

// 检查路径是目录还是文件
public static void mulu(String path_str) throws IOException {
    Path path = new Path(path_str);
    // 判断路径是否存在
    if (fs.exists(path)) {
        // 获取指定路径的详细信息
        FileStatus status = fs.getFileStatus(path);
        if (status.isDirectory()) {
            System.out.println(path + "这是一个目录");
        } else if (status.isFile()) {
            System.out.println(path + "这是一个文件");
        } else {
            System.out.println("这是一个未知类型");
        }
    } else {
        System.out.println("路径不存在");
    }
    //关闭资源
    fs.close();
}

    //调用
public static void main(String[] args) throws IOException {
    // 初始化客户端对象
    //构造一个配置对象,设置一个参数:访问的 HDFS 的 URL
    Configuration conf = new Configuration();
    //这里指定使用的是 HDFS
    conf.set("fs.defaultFS","hdfs://hadoop00:9000");
    //通过如下的方式进行客户端身份的设置
    System.setProperty("HADOOP_USER_NAME","root");
    //通过 FileSystem 的静态方法获取文件系统客户端对象
    fs = FileSystem.get(conf);  //抛出异常
    System.out.println("hdfs连接成功");
    
    //main()方法中调用

// list(“/”); //查看所有
//main()方法中调用
// fileList(“/”); //查看有什么文件
// fileList(“/input”); //查看有什么文件
//main()方法中调用
// count(“/”); //统计
//main()方法中调用
// mulu(“/exp/word.txt”); //检查路径是目录还是文件

写在最后

作为一名即将求职的程序员,面对一个可能跟近些年非常不同的 2019 年,你的就业机会和风口会出现在哪里?在这种新环境下,工作应该选择大厂还是小公司?已有几年工作经验的老兵,又应该如何保持和提升自身竞争力,转被动为主动?

就目前大环境来看,跳槽成功的难度比往年高很多。一个明显的感受:今年的面试,无论一面还是二面,都很考验Java程序员的技术功底。

最近我整理了一份复习用的面试题及面试高频的考点题及技术点梳理成一份“Java经典面试问题(含答案解析).pdf和一份网上搜集的“Java程序员面试笔试真题库.pdf”(实际上比预期多花了不少精力),包含分布式架构、高可扩展、高性能、高并发、Jvm性能调优、Spring,MyBatis,Nginx源码分析,Redis,ActiveMQ、Mycat、Netty、Kafka、Mysql、Zookeeper、Tomcat、Docker、Dubbo、Nginx等多个知识点高级进阶干货!

由于篇幅有限,为了方便大家观看,这里以图片的形式给大家展示部分的目录和答案截图!

Java经典面试问题(含答案解析)

阿里巴巴技术笔试心得

含答案解析).pdf**和一份网上搜集的“Java程序员面试笔试真题库.pdf”(实际上比预期多花了不少精力),包含分布式架构、高可扩展、高性能、高并发、Jvm性能调优、Spring,MyBatis,Nginx源码分析,Redis,ActiveMQ、Mycat、Netty、Kafka、Mysql、Zookeeper、Tomcat、Docker、Dubbo、Nginx等多个知识点高级进阶干货!

由于篇幅有限,为了方便大家观看,这里以图片的形式给大家展示部分的目录和答案截图!
[外链图片转存中…(img-0wqAC4x5-1716575182232)]

Java经典面试问题(含答案解析)

[外链图片转存中…(img-7u4LrVws-1716575182233)]

阿里巴巴技术笔试心得

[外链图片转存中…(img-5yfyfrVL-1716575182233)]

  • 4
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值