HDFS读写文件操作流程

最新推荐文章于 2023-05-29 15:01:58 发布

quguanghui1998

最新推荐文章于 2023-05-29 15:01:58 发布

阅读量252

点赞数

分类专栏： Hadoop 文章标签： hadoop 大数据 hdfs

本文链接：https://blog.csdn.net/quguanghui1998/article/details/106318006

版权

本文详细介绍了HDFS中读取和写入文件的流程。读取时，客户端通过DistributedFileSystem对象向NameNode请求数据，NameNode返回最近的DataNode信息，客户端依次从各个节点下载数据块。写入时，客户端创建DistributedFileSystem实例，NameNode分配数据节点，客户端建立通道，序列化写入数据到DataNode，并在完成时接收响应。

摘要由CSDN通过智能技术生成

1、读取文件：

1、客户端首先创建DistributedFileSystem对象

2、向NameNode发出下载请求

3、NameNode根据举例优先选择合适的节点以及数据块信息响应给客户端

4、客户端根据响应创建输出流下载数据，此时会先读取nn1数据，读取结束如果数据不够再建立下一个通道读取下一个节点数据，直到读取完毕。

案例：从hdfs上截取方式下载数据

@Test
    //文件截取，下载块文件（比如查日志的时候只查看最后一块）
    //查第一块
    public void readFileSeek1() throws URISyntaxException, IOException, InterruptedException {
        //获取对象
        Configuration conf = new Configuration ();
        FileSystem fs = FileSystem.get (new URI ("hdfs://hadoop01:9000"), conf, "root");

        //获取输入流
        FSDataInputStream fis = fs.open (new Path ("/hadoop-2.9.2.tar.gz"));

        //获取输出流
        FileOutputStream fos = new FileOutputStream (new File ("D:/hadoop-2.9.2.part1"));
        //文件拷贝(此时只拷128M)

最低0.47元/天解锁文章

quguanghui1998

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HDFS读写文件操作流程

1、读取文件：1、客户端首先创建DistributedFileSystem对象2、向NameNode发出下载请求3、NameNode根据举例优先选择合适的节点以及数据块信息响应给客户端4、客户端根据响应创建输出流下载数据，此时会先读取nn1数据，读取结束如果数据不够再建立下一个通道读取下一个节点数据，直到读取完毕。案例：从hdfs上截取方式下载数据@Test //文件截取，下载块文件（比如查日志的时候只查看最后一块） //查第一块 public void
复制链接

扫一扫

专栏目录