nifi探索之SplitText

Abstract

主要涉及到SplitText processor的设置,将一个text文件内容划分为多个flowfile。


主要参数介绍

NameDefault ValueAllowable ValuesDescription
Line Split Count设置拆分的行数,例如为1,则是每一行作为一个单独的拆分后的文件
Maximum Fragment Size每个拆分后的文件的所允许的最大的大小,header line包括在内。如果一个文件包含该header line,那么拆分后的每一个文件都会包含该header line
Maximum Fragment Size每个拆分后的文件的所允许的最大的大小,header line包括在内。如果一个文件包含该header line,那么拆分后的每一个文件都会包含该header line
Header Line Count0head line所占用的行数
Header Line Marker Characters0在整个文件中,标志header line的开始字符,如果Header line Count 设置为0,则该属性被忽略
Remove Trailing Newlinestruetrue;false设置是否删掉每个拆分后的文件末尾的换行符。如果拆分后的文件以后会进行merge操作,那么应设置为false;否则会产生一个内容为null的flow,这是在没有header line的情况下,那么这个空的flowfile将会被丢弃。如果原始的文件中包含header line,那么将不会产生内容为空的flowfile

SplitText配置
在这里设置line split count为1,也就是原始文件中的每一行都将成为一个新文件的内容


Troubleshooting(转自https://www.batchiq.com/database-extract-with-nifi.html 的Troubleshooting部分)
在nifi中可以通过Logging的方式帮助我们了解Processor的执行过程。需要在 nifi根目录下的conf/logback.xml中进行配置



通过这样配置,QueryDatabase和ExecuteSQL就可以将他们一些执行信息给Debug logger

2016-09-12 16:07:14,909 DEBUG [Timer-Driven Process Thread-2] o.a.n.p.standard.QueryDatabaseTable QueryDatabaseTable[id=2d63a256-6502-4735-a362-8ec6b9b81fc8]
Executing query SELECT id, uuid, created_at, screen_name, location, text FROM tweets WHERE id > 24780

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值