Eclipse实现DFS部分操作复习（2）

最新推荐文章于 2022-10-28 11:25:17 发布

Yuhua Wang

最新推荐文章于 2022-10-28 11:25:17 发布

阅读量723

点赞数

分类专栏： hadoop 文章标签： hadoop eclipse path

本文链接：https://blog.csdn.net/u011068475/article/details/53423084

版权

hadoop 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

本文复习《Hadoop权威指南》第三章，重点在于使用Eclipse进行Hadoop项目的开发。通过FileSystem的listStatus方法读取文件和目录元数据，并用stat2path转换。介绍了如何设置路径参数，以及实现PathFilter接口排除特定路径，举例说明了RegexExcludePathFilter的使用场景。

摘要由CSDN通过智能技术生成

本文用于复习《Hadoop权威指南》第三章后半部分内容

代码来自于书中，仅有少部分修改，主要是为了回忆起来方便

在文章eclipse实现word count中就有关于如何在eclipse中开发hadoop项目，链接如下Eclipse实现Hadoop WordCount

利用FileSystem的listStatus方法来读取文件和目录的元数据，再用stat2path方法讲status数组转为path数组。

这里用一种与之前不同的路径设置方法（虽然其实是与书上一样的），在run configuration中添加参数
hdfs://localhost:9000/ 和hdfs://localhost:9000/user/wyh/

    public class ListStatus {

  public static void main(String[] args) throws Exception {
    String uri = args[0];
    Configuration conf = new Configuration();
    FileSystem fs = FileSystem.get(URI.create(uri), conf);

    Path[] paths = new Path[args.length];
    for (int i = 0; i < paths.length; i++) {
      paths[i] = new Path(args[i]);
    }

    FileStatus[] status = fs.listStatus(paths);
    Path[] listedPaths = FileUtil.stat2Paths(status);
    for (Path p : listedPaths) {
      System.out.println(p);
    }
  }
}

书上给出了一个RegexExcludePathFilter类实现了PathFilter接口，用于排除一个正则表达式路径，也觉得挺有趣的，但是没有给具体实现排除的代码，在这里写了一个TestFilter类来实现一下。

首先把2016.12.01.txt和2016.12.02.txt放到分布式系统中，可以看到在去掉RegexExcludePathFilter的时候会两个文件都显示，直接运行则会显示路径+2016.12.02.txt。

     public class TestFilter {
      public static void main(String[] args) throws Exception {
            String uri = "hdfs://localhost:9000/";
            Configuration conf = new Configuration();
            FileSystem fs = FileSystem.get(URI.create(uri), conf);

            FileStatus[] status =fs.globStatus(new Path("hdfs://localhost:9000/user/wyh/2016.*.*")
            ,new RegexExcludePathFilter("hdfs://localhost:9000/user/wyh/2016.12.01.*"));
            // ,new RegexExcludePathFilter("hdfs://localhost:9000/user/wyh/2016.12.01.*")
            Path[] listedPaths = FileUtil.stat2Paths(status);
            for (Path p : listedPaths) {
              System.out.println(p);
            }
      }
}

Yuhua Wang

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Eclipse实现DFS部分操作复习（2）

本文用于复习《Hadoop权威指南》第三章后半部分内容代码来自于书中，仅有少部分修改，主要是为了回忆起来方便在文章eclipse实现word count中就有关于如何在eclipse中开发hadoop项目，链接如下Eclipse实现Hadoop WordCount利用FileSystem的listStatus方法来读取文件和目录的元数据，再用stat2path方法讲status数组转为path数组
复制链接

扫一扫

专栏目录