NiFi数据流实例一

NiFi数据流实例系列文章,是将我个人做过的一些数据流项目和探索整理成数据流实例,旨在提供NiFi实用方法。

示例说明

本实例构建一条最简单的数据流,从文件系统的一个本地目录读取文件,生成数据流,然后分别写入到另一个本地目录下和指定的HDFS目录下。

流程图

在这里插入图片描述

处理器配置

说明

每个处理器的配置窗口,有四个Tab,说明如下:

Tab描述
SETTINGS处理器信息的配置,例如处理器名称。可以说是一个处理器类型的实例。
SCHEDULING处理器的调度配置,可以进行定时调度和调整分配给此处理器的资源,例如可以使用的线程数。
PROPERTIES定义处理器的行为,是处理器配置的重点部分。
COMMENTS一个文本区,可以写一些描述信息或者其他信息,也可以不写任何内容。

详情可参考 Configuring a Processor

下面的处理器配置说明,我只写改动的和添加的配置部分。

GetFile

类型:GetFile

PROPERTIES:

NameValue
Input Directory/opt/xwd/input
PutFile

类型:PutFile

PROPERTIES:

NameValue
Directory/opt/xwd/localdir
PutHDFS

类型:PutHDFS

PROPERTIES:

NameValue
Hadoop Configuration Resources/etc/hadoop/conf/core-site.xml
Directory/nifi

测试运行

创建测试目录和文件
mkdir -p /opt/xwd/input
mkdir /opt/xwd/localdir
cd /opt/xwd
touch test.txt
echo 'Hello World!' > test.txt
测试数据流

确保GetFile处理器处于关闭状态,执行命令:

cd /opt/xwd
cp test.txt input/test0.txt

查看/opt/xwd/input目录,可发现test0.txt文件。

启动所有处理器。

再次查看/opt/xwd/input目录,没有任何文件。

查看/opt/xwd/localdir目录,可发现test0.txt文件。

查看HDFS的/nifi目录(hdfs dfs -ls /nifi),可发现test0.txt文件。

继续测试,执行命令:

cd /opt/xwd
cp test.txt input/test1.txt
cp test.txt input/test2.txt

查看/opt/xwd/input目录,会发现目录下没有任何文件。

如果想要保留数据流的源文件,这里是保留/opt/xwd/input目录下的文件,可以对GetFile处理进行如下设置:

NameValue
Keep Source Filetrue
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值