nifi ExecuteScript processor python和groovy语言实现

研究了几天nifi的ExecuteScript processor,在同事的帮助下终于调试通过了,记录python和groovy语言的不同实现:

python:

import json
import java.io
from org.apache.commons.io import IOUtils
from java.nio.charset import StandardCharsets
from org.apache.nifi.processor.io import StreamCallback
from org.apache.nifi.processors.script import ExecuteScript


class PyStreamCallback(StreamCallback):
    def __init__(self):
        pass

    def process(self, inputStream, outputStream):
        text = IOUtils.toString(inputStream, StandardCharsets.UTF_8)
        obj=json.load(text)
        newObj = {
            "Source": "NiFi",
            "ID": "python",
            "Name": "test"
            "meta_data": obj['meta']
        }
        outputStream.write(bytearray(json.dumps(newObj, indent=4).encode('utf-8')))


flowFile = session.get()
if flowFile != None:
    flowFile = session.write(flowFile, PyStreamCallback())
    session.transfer(flowFile, ExecuteScript.REL_SUCCESS)
else:
    pass

 

 

groovy:

import org.apache.commons.io.IOUtils
import java.nio.charset.*

def flowFile = session.get();

def slurper = new groovy.json.JsonSlurper()
if (flowFile == null) {
    return;
}
def flag=false
flowFile = session.write(flowFile,
    { inputStream, outputStream ->
            def text = IOUtils.toString(inputStream,StandardCharsets.UTF_8)    
            def obj = slurper.parseText(text)
            flag=false
            def bbdErrorLog= obj.bbd_error_log
            def bbdErrorLogs=bbdErrorLog.split("code\":")
            if(bbdErrorLogs.size()==2){
                if (bbdErrorLog.startsWith("[{\"message")){
                    errorLogCode=Integer.parseInt(bbdErrorLogs[1].split("}")[0])
                }else{
                    errorLogCode=Integer.parseInt(bbdErrorLogs[1].split(",")[0])
                }                
                if (errorLogCode==2000002){
                    pattern= ~"吊销|注销"
                    def enterprise_status=obj.enterprise_status
                    def company_type=obj.company_type
                    if (company_type=="农民专业合作社"||company_type=="集体所有制"||company_type=="股份合作制"){
                        flag=true
                    }else if(enterprise_status=~pattern){ 
                        flag=true
                    }
                }else if (errorLogCode==2000302){
                    flag=true
                }else if (errorLogCode==1000202){
                    pattern= ~"吊销|注销"
                    def enterprise_status=obj.enterprise_status
                    if(enterprise_status=~pattern){ 
                        flag=true
                    }
                }else if (errorLogCode==1001402){
                    pattern= ~/[\u4e00-\u9fa5]/
                    def regOrg=obj.regorg
                    if(regOrg==~pattern&&regOrg.length()<20){
                        flag=true
                    }
                }
            }else{
                errorLogList=[1000101,1000401,1000501,1000601,1001201,1001301,1001401,2000002]                
                isFind=true
                for (field in bbdErrorLogs){
                    if (field=="[{\""||field.startsWith("[{\"message\"")){
                        continue
                    }
                    int num = Integer.parseInt(field.substring(0,7))
                    if (errorLogList.find{it == num}==null){
                        isFind=false
                    }
                }
                if (isFind){
                    pattern= ~"吊销|注销"
                    def enterprise_status=obj.enterprise_status
                    if(enterprise_status=~pattern){ 
                        flag=true
                    }
                }
                
            }
            def builder = new groovy.json.JsonBuilder()
            builder.call(obj)
            outputStream.write(builder.toPrettyString().getBytes(StandardCharsets.UTF_8)) 
    } as StreamCallback)

    if(flag){
        flowFile = session.putAttribute(flowFile, "etl_flag", "DATA_MATCHED")
    }else{
        flowFile = session.putAttribute(flowFile, "etl_flag", "DATA_NOT_MATCH")
    }

session.transfer(flowFile, ExecuteScript.REL_SUCCESS)

转载于:https://my.oschina.net/u/2515462/blog/698524

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
NiFi中使用ExecuteScript执行Python脚本获取数据库连接,执行SQL,可以按照以下步骤进行操作: 1. 在NiFi中创建一个ExecuteScript处理器,并选择要执行的脚本语言Python。 2. 编写Python脚本,获取数据库连接,执行SQL并返回结果。以下是一个简单的示例: ```python from org.apache.nifi.processor.io import StreamCallback from org.apache.nifi.processor.util import StandardCharsets from org.apache.nifi.processor import * from java.io import BufferedReader, InputStreamReader import java.sql class PyStreamCallback(StreamCallback): def __init__(self): pass def process(self, inputStream, outputStream): connection = java.sql.DriverManager.getConnection('jdbc:mysql://localhost:3306/test', 'username', 'password') statement = connection.createStatement() resultSet = statement.executeQuery('SELECT * FROM table') while resultSet.next(): value = resultSet.getString('column_name') outputStream.write(bytearray(value, StandardCharsets.UTF_8)) flowFile = session.get() if flowFile != None: flowFile = session.write(flowFile, PyStreamCallback()) session.transfer(flowFile, REL_SUCCESS) ``` 在这个脚本中,我们首先导入了需要使用的Java类,包括StreamCallback、StandardCharsets、Processor等。然后定义了一个名为PyStreamCallback的类,继承自StreamCallback,用于处理输入流和输出流。 在process方法中,我们使用Java的JDBC API获取数据库连接,执行SQL语句,并将结果输出到输出流中。最后,我们使用NiFi的API将处理后的流传输到下一个处理器。 3. 配置ExecuteScript处理器的属性,包括Python解释器路径、脚本文件路径等。 4. 运行NiFi流程,执行Python脚本获取数据库连接,执行SQL并返回结果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值