hdfs user 连接_实训课 | KNIME的HDFS操作

1、实验摘要

  • 实验目的:学习KNIME的HDFS简单操作,文件上传、下载和删除。

  • 实验内容:连接HDFS;上传文件到HDFS;从HDFS下载文件;

2、实验步骤

(1)这次实验我们将介绍如何使用KNIME连接Hadoop hdfs进行一些简单的操作。整个工作流的概览如下:

4642e9fcdc5646c3702adbe98cf3edbc.png

(2)首先,使用“HDFS Connection”节点连接到我们的Hadoop文件系统。具体的设置如下图所示。“Host”填写集群master节点的ip地址(这里因为我们在client上做了host映射,所以填写的是master的hostname);“Port”填写HDFS的端口(一般是9000或者8020),可以通过查看hadoop的配置文件core-site.xml获取;“User”填写执行操作的用户名,确保该用户存在且具有相应的读写权限。

e087af6781bacbfc49fd3861114aae23.png

填写完毕后,测试连接,成功的话会出现如下的提示:

530735288e244469069b44c3917e27ab.png

(3)下面,我们使用“Data Generator”节点生成一些数据,然后用“CSV Writer”写到指定目录下。“Data Generator”采用默认设置,“CSV Writer”只修改存储路径,并将该路径存成一个变量,以供之后的节点使用,具体设置如下:

5d6e44e8870acb6b68c9aa4a546c512c.png

(4)之后,我们要对文件存储的路径进行一些处理,然后传给“Upload”节点。因为“CSV Writer”提供的地址是String类型的,而“Upload”接收的参数是Url类型,所以我们要使用“Variable to Table Row”和“String to URL”两个节点将文件地址转成Url类型。

1db4215228b4d7cc672732a7b4583473.png

右击“CSV Writer”节点,选择“Show Flow Variable Ports”,然后将节点右上角的“Outport”和“Variable to Table Row”相连:

a322aef5b86988b2c71edf0837942c5f.png

5d74d8500810b48a2a37593393b651ed.png

(5)选择“Upload”节点,连接“HDFS Connection”和“String to URL”。相关设置如下图,“Target folder”为hdfs的文件路径(根据实际情况修改,注意user对文件夹的操作权限),“Source”为文件源地址,由输入变量控制。

cdaec4033464a5b952a563e0e566fb15.png

执行成功后,我们在远端的HDFS中可以看到已经上传的文件:

576223f74f1bdb2e870148773efac58e.png

bce2606b11130a4a7955e026958673ff.png

(6)选择“List Remote Files”节点,列出远端的HDFS的文件目录。这里,我们将上一步中“Upload”的Source源地址作为变量传入到“List Remote Files”节点中。有了变量控制,“List Remote Files”节点就必须在“Upload”执行成功后才能执行。

a7cc598dcf7f0f90f9f917aaa23da711.png

0c4d62daaa8f39c18c90bfc885b6706e.png

结果显示:

efa6d4f7b6eb1ce79454f80a873542d4.png

(7)使用“Table Row to Variable”将文件路径转换为变量,传给“Download”节点。执行“Download”从HDFS将之前上传的文件下载下来。

7bf9c9b9941ac6577494d432e77f08d7.png

dd2270a310c3eb7c03dc2b8d311a41b0.png

通过“CSV Reader”读取下载的文件。使用“Table Different Check”节点对比该文件和原文件。执行成功,代表上传的文件和原文件没有差别,不存在数据丢失,原文件成功上传到HDFS。

822740a6dadce050abf82baec9fc7708.png

9b467781cb69dea647fb6344b4bd40ba.png

(8)使用“Delete Files”节点删除文件。因为有Input变量控制,所以只有在“Download”节点从HDFS将该文件成功下载后,删除操作才会执行:

4025b9f678f136c83f35012e74ab8dd7.png

结语:下次实验,我们将介绍Hive的相关操作。

相关文章:

  1. KNIME:图形化数据科学与机器学习计算平台的王者

  2. 实训课 | 创建并运行你的第一个KNIME工作流

  3. 实训课 | 《西游记》小说文本分析与可视化

  4. 实训课 | 《莎士比亚十四行诗》文本分析与可视化

  5. 实训课 | KNIME数据库操作

  6. 实训课 | KNIME数据的预处理和可视化(一)

  7. 实训课 | KNIME数据的预处理和可视化(二)

  8. 实训课 | KNIME的Titanic数据分析(三)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值