文章目录
NIFI 页面操作介绍
现在,NiFi已启动,我们可以启动用户界面(UI),以创建和监视我们的数据流。要开始使用,请打开网络浏览器并导航至http://localhost:8080/nifi。可以通过编辑conf目录中的nifi.properties文件来更改端口,但默认端口为8080。
用户界面具有多种工具来创建和管理您的第一个数据流:
· 工具栏
这里主要是构造数据流操作的主要面板。
添加模块(processor)
nifi内部会提供各个处理模块,当我们在进行数据处理的过程中,可以选择不同的模块并调整变量进行拼装,从而组合成一个完整的数据流处理的组。
添加数据流传入点(input-port)
虽说是数据流输入点,但是并不是整体数据流的起点。它是作为组与组之间的数据流连接的传入点与输出点。
添加数据流输出点(output-port)
同理上面的输入点。它是作为组与组之间的数据流连接的传入点与输出点。
添加组(process-group)
组相当于系统中的文件夹,作用就是使数据流的各个部分看起来更工整,思路更清晰,不至于从头到尾一条线阅读起来十分不方便。
添加远端的组(remote process-group)
根据弹出框进行信息配置,可加入远程的组。
拉取已有的文件(template)
每当做好一个完整的数据流后,可存储到本地为xml文件,nifi支持本地的template上传,这个按钮就是在上传本地template之后,选择上传过的一个获取到操作画布上。
添加便签(label)
相当于便签,可放置在画布空白处,写上备注信息。
· Navigate
这一部分是对区域一这个画布的缩小预览,点击放大缩小可调整视野,蓝框区域就是画布当前的界面,可用鼠标在这部分进行移动从而调整画布的视野。
· 操作栏
开始运行
选中模块并点击运行按钮,开始进行对数据流的处理。
停止运行
选中模块并点击停止按钮,则停止了进行对数据流的处理。
保存template
选择你要保存的一个template,点击这个保存按钮,可把这个template保存到
nifi系统里(并不是电脑本地,如果想保存到电脑本地,可点击右上角这个按钮,选择Template,弹出的页面上有下载选项)。
上传template
可上传本地的template(xml文件)到nifi系统里。
拖拽处理器
选择处理器,add添加到画布
将处理器拖到画布上后,可以通过右键单击处理器并从上下文菜单中选择一个选项来与其进行交互。根据分配给您的权限,上下文菜单中可用的选项会有所不同。
虽然上下文菜单中的选项有所不同,但是当您具有使用处理器的完全权限时,通常可以使用以下选项:
· Configure(配置):此选项允许用户建立或更改处理器的配置。
· Start(启动或停止):此选项允许用户启动或停止处理器; 该选项可以是Start或Stop,具体取决于处理器的当前状态。
· Disable(启用或禁用):此选项允许用户启用或启用处理器; 该选项将为“启用”或“禁用”,具体取决于处理器的当前状态。
· View data provenance(查看数据来源):此选项显示NiFi数据来源表,其中包含有关通过该处理器路由的FlowFiles的数据来源事件的信息。
· View status history(查看状态历史记录):此选项打开处理器统计信息随时间的图形表示。
· View usage(查看用法):此选项将用户带到处理器的使用文档。
· View connection → Upstream(查看连接→上游):此选项允许用户查看和“跳转”
入处理器的上游连接。当处理器连接进出其他进程组时,这尤其有用。
· View connection → Downstream(查看连接→下游):此选项允许用户查看和“跳转”
到处理器外的下游连接。当处理器连接进出其他进程组时,这尤其有用。
· Centere in view(视图中心):此选项将画布的视图置于给定的处理器上。
· Change color(更改颜色):此选项允许用户更改处理器的颜色,这可以使大流量的可视化管理更容易。
· Create template(创建模板):此选项允许用户从所选处理器创建模板。
· Copy(复制):此选项将所选处理器的副本放在剪贴板上,以便可以通过右键单击画布并选择“粘贴”将其粘贴到画布上的其他位置。复制/粘贴操作也可以使用按键Ctrl-C(Command-C)和Ctrl-V(Command-V)完成。
· Delete(删除):此选项允许从画布中删除处理器。
选择配置选项
设置选项卡
“处理器配置”对话框中的第一个选项卡是“设置”选项卡
Name:Processor名称,默认与处理器类型相同,可以更改。处理器名称旁边是一个复选框,指示处理器是否已启用。
Id:Processor唯一标识符以及Processor的类型和NAR包,无法修改。
Type:Processor类型,无法更改。
Bundle:Processor 的NAR包,无法更改。
Penalty Duration(惩罚持续时间):在处理一段数据(FlowFile)的正常过程期间,可能发生事件,该事件指示此时不但是数据可以在稍后的时间处理。
Yield Duration::处理器可以确定存在某种情况,使得处理器不再能够进行任何进展,而不管其正在处理的数据,这将阻止处理器被安排运行一段时间。
Bulletin Level(公告):每当处理器写入其日志时,处理器也将生成公告。此设置指示应在用户界面中显示的最低级别的公告。默认情况下,公告级别设置为WARN,这意味着它将显示所有警告和错误级别公告。
Automatically Terminate Relationships(自动终止关系):为了使处理器被视为有效且能够运行,处理器定义的每个关系必须连接到下游组件或自动终止。
· 调度选项卡
“处理器配置”对话框中的第二个选项卡是“计划”选项卡:
NiFi支持三种调度策略,包括Time Driven(时间驱动)、CRON Driven(CRON驱动)和Event Driven(事件驱动,非可选):
Time Driven:这是默认模式。处理器将安排定期运行。处理器运行的时间间隔由“运行计划”选项定义。
Event Driven:当选择此模式时,处理器将被触发以事件运行,并且当FlowFiles输入连接到此处理器的连接时会发生该事件。此模式目前被认为是实验性的,并且不受所有处理器的支持。选择此模式时,“运行计划”选项不可配置,因为处理器不会触发为定期运行,而是作为事件的结果。此外,这是“并行任务”选项可以设置为0的唯一模式。在这种情况下,线程数量仅受管理员配置的事件驱动线程池大小的限制。
CRON驱动:当使用CRON驱动的调度模式时,处理器被安排定期运行,类似于定时器驱动的调度模式。然而,CRON驱动模式提供了更大的灵活性,但增加了配置的复杂性。CRON驱动的调度值是由六个必填字段和一个可选字段组成的字符串,每个字段由一个空格分隔。
CRON的各参数含义分别代表:秒、分、时、日、月、周、年,需要配合*、?和L共同执行(*代表字段的值都有效;?代表对于指定的字段不指定值;L代表长整形)。如:“0 0 13 * * ?”代表想要在每天下午1点进行调度执行。根据业务需求进行参数的调度配置。
详情请参阅Quartz文档中的Chron Trigger教程。
· 属性选项卡
Properties选项卡提供了一种配置特定于Processor的行为的机制。