Hadoop权威指南读书笔记（第三章Hadoop分布式文件系统）

最新推荐文章于 2024-03-07 14:44:40 发布

根根根

最新推荐文章于 2024-03-07 14:44:40 发布

阅读量247

点赞数

分类专栏： Hadoop

本文链接：https://blog.csdn.net/m251845121/article/details/52193626

版权

Hadoop 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

HDFS的设计建立在这样一个思想上：一次写入、多次读取是最高效的

HDFS中fsck指令会显示块的信息：% hadoop fsck / -files -blocks

HDFS中的名称节点与数据节点

HDFS集群有两种节点：一个名称节点（管理者）和多个数据节点（工作者）注：没有名称节点文件系统将无法使用

基本文件系统操作：

1 -copyFromLocal 将本地文件copy到localhost上的HDFS中

2 -copyToLocal 将HDFS中的文件copy到本地

3 查看HDFS文件列表的命令：% hadoop fs -ls .

HDFS中的JAVA接口：

1 从Hadoop URL中读取数据

public class URLCat {

  static {
    URL.setURLStreamHandlerFactory(new FsUrlStreamHandlerFactory());
  }

  public static void main(String[] args) throws Exception {
    InputStream in = null;
    try {
      in = new URL(args[0]).openStream();
      IOUtils.copyBytes(in, System.out, 4096, false);
    } finally {
      IOUtils.closeStream(in);
    }
  }
}

上述方法中的setURLStreamHandlerFactory在JVM中只能调用一次。

2 使用FileSystem API 读取数据

public class FileSystemCat {

  public static void main(String[] args) throws Exception {
    String uri = args[0];
    Configuration conf = new Configuration();
    FileSystem fs = FileSystem.get(URI.create(uri), conf);
    InputStream in = null;
    try {
      in = fs.open(new Path(uri));
      IOUtils.copyBytes(in, System.out, 4096, false);
    } finally {
      IOUtils.closeStream(in);
    }
  }
}

根根根

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop权威指南读书笔记（第三章Hadoop分布式文件系统）

HDFS的设计建立在这样一个思想上：一次写入、多次读取是最高效的HDFS中fsck指令会显示块的信息：% hadoop fsck / -files -blocksHDFS中的名称节点与数据节点HDFS集群有两种节点：一个名称节点（管理者）和多个数据节点（工作者）注：没有名称节点文件系统将无法使用基本文件系统操作：1 -copyFromLocal 将本地文件copy到loc
复制链接

扫一扫

专栏目录