本人一名大四软件工程专业帅哥,现在进一家科技公司实习,在利用flink处理文件时发现了一些好玩的东西,看没有谁发过,就发来玩玩
想让Flink程序一直在running的话,只能让他不断循环读取数据,自定义Source即可,代码如下
import org.apache.flink.streaming.api.functions.source.RichParallelSourceFunction;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.time.Duration;
import java.time.LocalDateTime;
import java.time.LocalTime;
public class ReadeHdfsSource extends RichParallelSourceFunction<String