大数据之Hadoop(HDFS客户端操作)

3.1 HDFS客户端环境准备

1、根据电脑的操作系统拷贝对应的编译后的hadoop jar包到非中文路径。
在这里插入图片描述
2、配置HADOOP_HOME环境变量
在这里插入图片描述
3、配置Path环境变量
在这里插入图片描述
4、创建一个Maven工程HdfsClientDemon
在这里插入图片描述
5、导入相应的依赖

<dependencies>
		<dependency>
			<groupId>junit</groupId>
			<artifactId>junit</artifactId>
			<version>RELEASE</version>
		</dependency>
		<dependency>
			<groupId>org.apache.logging.log4j</groupId>
			<artifactId>log4j-core</artifactId>
			<version>2.8.2</version>
		</dependency>
		<dependency>
			<groupId>org.apache.hadoop</groupId>
			<artifactId>hadoop-common</artifactId>
			<version>2.7.2</version>
		</dependency>
		<dependency>
			<groupId>org.apache.hadoop</groupId>
			<artifactId>hadoop-client</artifactId>
			<version>2.7.2</version>
		</dependency>
		<dependency>
			<groupId>org.apache.hadoop</groupId>
			<artifactId>hadoop-hdfs</artifactId>
			<version>2.7.2</version>
		</dependency>
		<dependency>
			<groupId>jdk.tools</groupId>
			<artifactId>jdk.tools</artifactId>
			<version>1.8</version>
			<scope>system</scope>
			<systemPath>${JAVA_HOME}/lib/tools.jar</systemPath>
		</dependency>
</dependencies>

在项目的src/main/resources目录下,新建一个文件,命令为“log4j.properties”,在文件中写入

log4j.rootLogger=INFO, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n
log4j.appender.logfile=org.apache.log4j.FileAppender
log4j.appender.logfile.File=target/spring.log
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n

6、创建包名:com.atguigu.hdfs
在这里插入图片描述
7、创建HdfsClient类

package com.atguigu.hdfs;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;

import java.io.IOException;
import java.net.URI;
import java.net.URISyntaxException;

public class HdfsClient {
   
    public static void main(String[] args) throws URISyntaxException, IOException, InterruptedException {
   
        // 1 获取文件系统
        Configuration configuration = new Configuration();
        // 配置在集群上运行
        FileSystem fs = FileSystem.get(new URI("hdfs://hadoop102:9000"), configuration, "atguigu");

        // 2 创建目录
        fs.mkdirs(new Path("/2021-1-5/yw"));

        // 3 关闭资源
        fs.close();
    
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Hadoop分布式文件系统(HDFS)是Hadoop的核心组件之一,它是一个分布式文件系统,旨在存储大量数据,并提供高吞吐量数据访问。HDFS采用管理者-工作者模式运行,其中一个NameNode(管理者)和多个DataNode(工作者)组成集群。NameNode负责管理文件系统命名空间,以及控制客户端对文件的访问。DataNode负责存储实际的数据块,并响应客户端读写请求。 HDFS的主要特点包括: - 高容错性:HDFS采用数据复制的方式来实现容错性,即将数据块复制到多个DataNode上,以保证即使某个节点出现故障,数据仍然可用。 - 适合大数据存储:HDFS适合存储大量数据,因为它可以将数据划分为多个数据块,并将这些数据块分布在不同的DataNode上,以实现并行处理。 - 流式数据访问:HDFS支持流式数据访问,即一次性读取或写入大量数据,而不是随机访问。 - 可扩展性:HDFS可以通过添加更多的DataNode来扩展存储容量和吞吐量。 下面是HDFS的一些常用命令: - hdfs dfs -ls /:列出根目录下的所有文件和目录。 - hdfs dfs -mkdir /test:在根目录下创建一个名为test的目录。 - hdfs dfs -put localfile /test:将本地文件localfile上传到HDFS的/test目录下。 - hdfs dfs -get /test/remotefile localfile:将HDFS上的/test/remotefile文件下载到本地文件localfile中。 - hdfs dfs -rm /test/remotefile:删除HDFS上的/test/remotefile文件。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值