将linux本地文件夹上传到hdfs服务器

import java.io.BufferedInputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;
import java.io.OutputStream;


import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;
import org.apache.hadoop.util.Progressable;


//运行方式:指定两个输入参数,依次为 本地文件(或文件夹)路径、HDFS文件(或文件夹)路径
public class UploadAll {

public static void main(String[] args) throws Exception {
if(args.length < 2){
System.out.println("Please input two number");
System.exit(2);
}
String localSrc = args[0];
String dst = args[1];
Configuration conf = new Configuration();
File srcFile = new File(localSrc);
if(srcFile.isDirectory()){
copyDirectory(localSrc , dst , conf);
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 要将Linux本地文件上传到HDFS,可以使用以下命令: ``` hadoop fs -put /本地文件路径 /HDFS文件路径 ``` 其中,/本地文件路径是要上传的本地文件的路径,/HDFS文件路径是要上传到HDFS文件的路径。 例如,如果要将本地文件/home/user/file.txt传到HDFS的/user/hadoop目录下,可以使用以下命令: ``` hadoop fs -put /home/user/file.txt /user/hadoop/ ``` 这将把本地文件file.txt传到HDFS的/user/hadoop目录下。 ### 回答2: 在将本地文件上传到HDFS之前,需要先确保在本地机器上已经安装了Hadoop并且已经启动了HDFS服务。在本地机器上,我们可以使用命令行或者Hadoop WebUI界面来上传文件。 1. 使用命令行上传文件到HDFS (1)在本地创建一个新文件夹,并将待上传的文件储存在该文件夹中。 (2)使用以下命令将本地文件上传到HDFS: `hdfs dfs -put /path/to/local/file /path/to/hdfs/directory` 其中,`/path/to/local/file` 是本地文件的路径,`/path/to/hdfs/directory` 是HDFS上的目录路径。 (3)输入命令后,统会自动将本地文件上传到HDFS中指定的目录中。 2. 使用Hadoop WebUI上传文件到HDFS (1)打开Hadoop WebUI界面,并登录。 (2)选择“File Browser”选项,进入HDFS文件浏览器。 (3)在左侧栏中选择要将文件上传到的目录。 (4)在右侧栏中选择“Upload”选项,在弹出的窗口中点击“Browse”按钮,选择本地文件并确认选择。 (5)点击“Upload”按钮,统会自动将本地文件上传到HDFS中指定的目录中。 无论是使用命令行还是Hadoop WebUI,上传文件的过程都比较简单,但需要注意的是,上传的文件必须符合HDFS上文件统的规则,否则将会上传失败。同时,在上传之前,也需要先确保HDFS统的可用性和文件上传的权限。 ### 回答3: HDFSHadoop Distributed File System)是Hadoop中非常重要的一个组成部分,它是一个分布式文件统,在存储大规模数据集时具有很高的可靠性、可扩展性和高吞吐量。在Hadoop中,很多数据的处理和分析都是基于HDFS文件统的,因此在使用Hadoop时,HDFS的使用也是非常重要的。 在Linux统中,如果我们需要将本地文件上传到HDFS,一般需要通过hadoop客户端工具进行操作。以下是一个常规的上传文件的步骤: 1. 获得hadoop客户端工具所在的路径。在Linux统中,可以通过使用“which hadoop”命令来找到hadoop客户端工具的安装路径,并记录该路径。 2. 进入本地文件所在的目录。使用命令“cd 文件路径”进入到本地文件所在的目录。 3. 执行hdfs上传命令。使用hadoop客户端工具中的hdfs命令,执行文件上传命令。例如,将本地文件test.txt传到HDFS中的/user/hadoop/test目录中的命令为: hdfs dfs -put test.txt /user/hadoop/test/ 执行该命令后,文件就会被上传到HDFS中。 需要注意的是,在执行上传命令时,上传目录必须已经存在,否则上传操作将会失败。此外,如果上传的文件名在HDFS中已经存在,也需要指定覆盖操作,否则上传操作也会出现异常。在上传大量的文件时,建议使用命令行中的通配符*来进行指定,可以避免重复操作。 总之,通过hadoop客户端工具,将Linux本地文件上传到HDFS非常简单。只需要按照上面的步骤操作即可。上传文件到HDFSHadoop生态统中常用的操作之一,具有很重要的使用价值。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值