nifi将mysql数据导到hdfs_用Nifi 从web api 取数据到HDFS

本文介绍了如何使用Nifi将MySQL数据库中的数据导出,并通过Web API获取到数据,然后将这些数据写入到HDFS中。过程中涉及到日期生成、数据分隔、URL和文件名构建、HTTP请求以及最终的HDFS存储。同时,文章提到了一些关键配置,如设置文件名以避免冲突,以及每天定时更新数据。
摘要由CSDN通过智能技术生成

import org.apache.commons.io.IOUtils

import java.nio.charset.*

import java.text.SimpleDateFormat;

import java.lang.StringBuilder;

import java.util.Calendar;

def flowFile = session.create()

def days = 10000

flowFile = session.write(flowFile, {inputStream, outputStream ->

SimpleDateFormat sdf = new SimpleDateFormat("yyyyMMdd");

Calendar cal = Calendar.getInstance();

StringBuilder sb = new StringBuilder();

cal.add(Calendar.DATE,1)

for(int i = 0; i < days; i++) {

cal.add(Calendar.DATE, -1);

sb.append(sdf.format(cal.getTime()) + "\n" );

}

//println(sb);

outputStream.write(sb.toString().getBytes(StandardCharsets.UTF_8))

} as StreamCallback)

//flowFile = session.putAttribute(flowFile, 'filename', 'get_date')

session.transfer(flowFile, REL_SUCCESS)

3. 用SplitText生成每行一个的日期

Line Split Count    1

4. 用ExtractText 取到日期参数

fb9d9343185b9c36c04efc5af5602912.png

5. 用UpdateAttribute生成url及filename

a14895af26f9e64b2e3903d816b28bfe.png

这里一定要设置filename,不然,所有的文件名都一样,最后只能成功插入一个记录到HDFS。

6.  用InvokeHttp获取数据

aedd46ffb8fc37525cf5dd4c9e7cb0f2.png

aaf6b0ede560661a7a173c5dc864f6e4.png

7. 添加一个 RouteOnContent来过滤空数据

5e324e8d84325442a88a95e8cd572f00.png

8. 用PutHDFS把数据插入到HDFS

8fb317d7056ae2564eecc110ba949ab5.png

注意这里的Directory 要加上/, 不然就插入到user/root/nifi下了,而不是files下在的nifi了。

9. 每天更新数据

5ea640a2d7f4bdcb585becf0f10e2b6e.png

每天20点更新数据

代码小改下:

def count = 1

NIFI 中国社区 QQ群:595034369

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值