传智---Haoop--(6)--hdfs文件操作

最新推荐文章于 2023-01-21 09:45:23 发布

b7410852963

最新推荐文章于 2023-01-21 09:45:23 发布

阅读量926

点赞数

分类专栏： Hadoop 文章标签： hadoop hdfs

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/b7410852963/article/details/41514741

版权

Hadoop 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

package com.hdfs;

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.net.URI;
import java.net.URISyntaxException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;
import org.apache.jasper.tagplugins.jstl.core.Url;

public class APP2 {
public static final String HDFS_PATH = "hdfs://hadoop:9000";
public static final String DIR_PATH = "/d2";
public static final String DIR_PATH2 = "/d2/d22";

public static void main(String[] args) throws Exception {

final FileSystem fileSystem = FileSystem.get(new URI(HDFS_PATH),
new Configuration());

// 创建文件夹
CreatFile(fileSystem);
// 上传文件
uploadDate(fileSystem);

// 下载文件
downFiel(fileSystem);
// 删除文件

deletedFile(fileSystem);

}

private static void deletedFile(final FileSystem fileSystem)
throws IOException {
//path 是目录 true 文件是 ----随便
fileSystem.delete(new Path(DIR_PATH2), true);
}

private static void downFiel(final FileSystem fileSystem)
throws IOException {

final FSDataInputStream in = fileSystem.open(new Path(DIR_PATH2));
IOUtils.copyBytes(in, System.out, 1024, true);
}

private static void CreatFile(final FileSystem fileSystem)
throws IOException {
fileSystem.mkdirs(new Path(DIR_PATH));
}

private static void uploadDate(final FileSystem fileSystem)
throws FileNotFoundException, IOException {
final FileInputStream in = new FileInputStream("F:/123.txt");

final FSDataOutputStream out = fileSystem.create(new Path(DIR_PATH2));
IOUtils.copyBytes(in, out, 1024, true);
}
}

//=================================================================

1.HDFS特点

：高容性，可以部署在低廉的硬件上，提供高吞吐量，访问应用程序的数据，适合超大数据集应用数据

：硬件故障，是常态，而不是异常，整个HDFS系统是由数百上千存储文件数据片段的服务器组成，实际上它里面有非常多的

组成部分，每一组都会频繁出现故障，意味着，HDFS的一些组成部分总是失效的，因此，故障检测和自动快速恢复是HDFS一个核心

的结构目标

：流式的数据访问，运行在HDFS上的应用程序必须流式访问他们的数据集，HDFS设计是适合批量处理，而不是用户交互式的。重点是

数据吞吐量，而不是数据的反应时间

：大数据集，应该提供很高的聚合数据宽带，应该一个集合群支持数百个节点，还应该支持一个集群中千万的文件

：简单一致性模型，大部分的HDFS程序文件操作需要一次写入，多次读取，一个文件一旦创建，不能修改，简单化了数据

数据一致性的问题和高吞吐量的数据访问

HDFS暴漏文件名字空间，并且允许用户数据存储成文件，内部机制是讲一个文件分割成一个或者多个的块，将这些块

存储在一组数据节点中

：名字节点和数据节点

NameNode——是一个管理文件名字空间和调节客户端访问文件的主服务器，操作文件名字空间的文件或目录操作，如打开，关闭

命名等，他同时确定块和数据节点映射

DateNode———是一个和多个用来管理存储，负责来至文件系统的客户的读写要求，同时执行块的创建，删除和来之名字节点的块负责指示

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
传智---Haoop--(6)--hdfs文件操作

package com.hdfs;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.IOException;import java.net.URI;import java.net.URISyntaxException;import org.apache
复制链接

扫一扫

专栏目录

b7410852963 CSDN认证博客专家 CSDN认证企业博客

码龄12年

63: 原创

6万+: 周排名

60万+: 总排名

12万+: 访问

: 等级

1722: 积分

16: 粉丝

45: 获赞

9: 评论

69: 收藏

私信

关注

热门文章

分类专栏

web回炉重造 3篇
React 1篇
web项目 11篇
Plugin 1篇
面试 6篇
Spring4 11篇
HIbernate 1篇
Hadoop 8篇
JAVA 19篇
JfreeChart 1篇
web 思想之路 5篇
Jquery 3篇

最新评论

WebSocket 注解（一）
The Straight: 感谢分享+翻译优质文章
React cdn 引用为什么要＜script type=‘text/babel‘＞＜/script＞
干坏事p过: 前排支持一下,可以的话来我博客看看吧
细说JavaScript 导出上万条Excel数据
963272311: 数据前面加单引号就可以解决了
微前端的应用
helinblog: 很好，很实用，赞👍🏻👍🏻👍🏻👍🏻👍🏻👍🏻👍🏻👍🏻👍🏻👍🏻👍🏻👍🏻
细说JavaScript 导出上万条Excel数据
qq_39853876: 亲，这个怎么解决导出表格数据出现科学计数法的问题啊？跪求！！！！！！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。