Flink实战-订单支付和对账情况监控(分别使用CEP和ProcessFunction来实现)

在电商网站中,订单的支付作为直接与钱挂钩的一环,在业务流程中非常重要。对于订单而言,为了正确控制业务流程,也为了增加用户的支付意愿,网站一般会设置一个支付失效时间,超过一段时间没支付的订单就会被取消。另外,对于订单的支付,还应该保证最终支付的正确性,可以通过第三方支付平台的交易数据来做一个实时对账
第一个实现的效果,实时获取订单数据,分析订单的支付情况,分别实时统计支付成功的和15分钟后支付超时的情况
新建一个maven项目,这是基础依赖,如果之前引入了,就不用加了

<maven.compiler.source>8</maven.compiler.source>
<maven.compiler.target>8</maven.compiler.target>

    <flink.version>1.10.1</flink.version>
    <scala.binary.version>2.12</scala.binary.version>
    <kafka.version>2.2.0</kafka.version>
</properties>
<dependencies>
    <dependency>
        <groupId>org.apache.flink</groupId>
        <artifactId>flink-scala_${scala.binary.version}</artifactId>
        <version>${flink.version}</version>
    </dependency>
    <dependency>
        <groupId>org.apache.flink</groupId>
        <artifactId>flink-streaming-scala_${scala.binary.version}</artifactId>
        <version>${flink.version}</version>
    </dependency>
    <dependency>
        <groupId>org.apache.kafka</groupId>
        <artifactId>kafka_${scala.binary.version}</artifactId>
        <version>${kafka.version}</version>
    </dependency>
    <dependency>
        <groupId>org.apache.flink</groupId>
        <artifactId>flink-connector-kafka_${scala.binary.version}</artifactId>
        <version>${flink.version}</version>
    </dependency>
    <dependency>
        <groupId>cn.hutool</groupId>
        <artifactId>hutool-all</artifactId>
        <version>5.5.6</version>
    </dependency>
    <dependency>
        <groupId>org.apache.flink</groupId>
        <artifactId>flink-table-planner-blink_2.12</artifactId>
        <version>1.10.1</version>
    </dependency>
</dependencies>

这个场景需要用到cep,所以再加入cep依赖


org.apache.flink
flink-cep-scala_ s c a l a . b i n a r y . v e r s i o n < / a r t i f a c t I d > < v e r s i o n > {scala.binary.version}</artifactId> <version> scala.binary.version</artifactId><version>{flink.version}


准备数据源文件src/main/resources/OrderLog.csv:
1234,create,1611047605
1235,create,1611047606
1236,create,1611047606
1234,pay,akdb3833,1611047616
把java目录改为scala,新建com.mafei.orderPayMonitor.OrderTimeoutMonitor.scala 的object
/*
*

  • @author mafei
  • @date 2021/1/31
    */
    package com.mafei.orderPayMonitor

import org.apache.flink.cep.{PatternSelectFunction, PatternTimeoutFunction}
import org.apache.flink.cep.scala.CEP
import org.apache.flink.cep.scala.pattern.Pattern
import org.apache.flink.streaming.api.TimeCharacteristic
import org.apache.flink.streaming.api.scala.{OutputTag, StreamExecutionEnvironment, createTypeInformation}
import org.apache.flink.streaming.api.windowing.time.Time

import java.util

/**

  • 定义输入样例类类型,
  • @param orderId 订单id
  • @param eventType 事件类别: 创建订单create还是支付订单pay
  • @param txId 支付流水号
  • @param ts 时间
    */

case class OrderEvent(orderId: Long, eventType:String,txId: String, ts: Long)

/**

  • 定义输出样例类类型,
    */
    case class OrderResult(orderId: Long, resultMsg: String)

object OrderTimeoutMonitor {
def main(args: Array[String]): Unit = {
val env = StreamExecutionEnvironment.getExecutionEnvironment
env.setParallelism(1)
env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime)

// 1、从文件中读取数据
val resource = getClass.getResource("/OrderLog.csv")
val orderEvnetStream = env.readTextFile(resource.getPath)
  .map(d=>{
    val arr = d.split(",")
    OrderEvent(arr(0).toLong,arr(1),arr(2), arr(3).toLong)  //把数据读出来转换成想要的样例类类型
  }).assignAscendingTimestamps(_.ts * 1000L)  //指定ts字段
  .keyBy(_.orderId) //按照订单id分组

/**
 * 2、定义事件-匹配模式
 *  定义15分钟内能发现订单创建和支付
 */
val orderPayPattern = Pattern
  .begin[OrderEvent]("create").where(_.eventType == "create")  //先出现一个订单创建的事件
    .followedBy("pay").where(_.eventType == "pay")            //后边再出来一个支付事件
  .within(Time.minutes(15))                                //定义在15分钟以内,触发这2个事件

// 3、将pattern应用到流里面,进行模式检测
val patternStream = CEP.pattern(orderEvnetStream, orderPayPattern)

//4、定义一个侧输出流标签,用于处理超时事件
val orderTimeoutTag = new OutputTag[OrderResult]("orderTimeout")

// 5、调用select 方法,提取并处理匹配的成功字符事件以及超时事件
val resultStream = patternStream.select(
  orderTimeoutTag,
  new OrderTimeoutSelect(),
  new OrderPaySelect()
)

resultStream.print("pay")
resultStream.getSideOutput(orderTimeoutTag).print()

env.execute(" order timeout monitor")

}
}

//获取超时之后定义的事件还没触发的情况,也就是订单支付超时了。
class OrderTimeoutSelect() extends PatternTimeoutFunction[OrderEvent, OrderResult]{
override def timeout(map: util.Map[String, util.List[OrderEvent]], l: Long): OrderResult = {
val timeoutOrderId = map.get(“create”).iterator().next().orderId
OrderResult(timeoutOrderId, “超时了。。。。超时时间:”+l)
}
}

class OrderPaySelect() extends PatternSelectFunction[OrderEvent, OrderResult]{
override def select(map: util.Map[String, util.List[OrderEvent]]): OrderResult = {

val orderTs = map.get("create").iterator().next().ts
val paydTs = map.get("pay").iterator().next().ts
val payedOrderId = map.get("pay").iterator().next().orderId
OrderResult(payedOrderId, "订单支付成功,下单时间:"+orderTs+" 支付时间:"+paydTs)

}
}
用ProcessFunction来实现上面的场景
csv还可以用上面的数据,新建一个scala的object src/main/scala/com/mafei/orderPayMonitor/OrderTimeoutMonitorWithProcessFunction.scala
/*
*

  • @author mafei
  • @date 2021/1/31
    */
    package com.mafei.orderPayMonitor

import org.apache.flink.api.common.state.{ValueState, ValueStateDescriptor}
import org.apache.flink.streaming.api.TimeCharacteristic
import org.apache.flink.streaming.api.functions.KeyedProcessFunction
import org.apache.flink.streaming.api.scala.{OutputTag, StreamExecutionEnvironment, createTypeInformation}
import org.apache.flink.util.Collector

object OrderTimeoutMonitorWithProcessFunction {
def main(args: Array[String]): Unit = {
val env = StreamExecutionEnvironment.getExecutionEnvironment
env.setParallelism(1)
env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime)

// 1、从文件中读取数据
val resource = getClass.getResource("/OrderLog.csv")
val orderEventStream = env.readTextFile(resource.getPath)
  .map(d=>{
    val arr = d.split(",")
    OrderEvent(arr(0).toLong,arr(1),arr(2), arr(3).toLong)  //把数据读出来转换成想要的样例类类型
  }).assignAscendingTimestamps(_.ts * 1000L)  //指定ts字段
  .keyBy(_.orderId) //按照订单id分组

val resultStream = orderEventStream
  .process(new OrderPayMatchProcess())
resultStream.print("支付成功的: ")

resultStream.getSideOutput(new OutputTag[OrderResult]("timeout")).print("订单超时事件")

env.execute("订单支付监控with ProcessFunction")

}
}

class OrderPayMatchProcess() extends KeyedProcessFunction[Long, OrderEvent, OrderResult]{
// 先定义状态标识,标识create、payed、是否已经出现,以及对应的时间戳
lazy val isCreateOrderState: ValueState[Boolean] = getRuntimeContext.getState(new ValueStateDescriptor[Boolean](“isCreateOrderState”, classOf[Boolean]))
lazy val isPayedOrderState: ValueState[Boolean] = getRuntimeContext.getState(new ValueStateDescriptor[Boolean](“isPayedOrderState”, classOf[Boolean]))
lazy val timerTsState : ValueState[Long] = getRuntimeContext.getState(new ValueStateDescriptor[Long](“timerTsState”, classOf[Long]))

// 定义一个侧输出流,捕获timeout的订单信息
val orderTimeoutOutputTag = new OutputTag[OrderResult]

override def onTimer(timestamp: Long, ctx: KeyedProcessFunction[Long, OrderEvent, OrderResult]#OnTimerContext, out: Collector[OrderResult]): Unit = {

//到这里,肯定不会出现订单创建和支付同时存在的情况,因为会在processElement处理掉

//如果只有订单创建
if (isCreateOrderState.value()){
  ctx.output(orderTimeoutOutputTag,OrderResult(ctx.getCurrentKey,"订单没支付或超时"))
}else if(isPayedOrderState.value()){
  ctx.output(orderTimeoutOutputTag, OrderResult(ctx.getCurrentKey,"只有支付,没看到订单提交"))
}
isCreateOrderState.clear()
isPayedOrderState.clear()
timerTsState.clear()

}

override def processElement(i: OrderEvent, context: KeyedProcessFunction[Long, OrderEvent, OrderResult]#Context, collector: Collector[OrderResult]): Unit = {
/**
* 判断当前事件类型,是create还是pay
* 分几种情况:
* 1、判断create和pay都来了
* 要看有没有超时,没有超时就正常输出
* 超时了输出到侧输出流
* 2、create或者pay有一个没来
* 注册一个定时器等着,然后等定时器触发后再输出
*
/
val isCreate = isCreateOrderState.value()
val isPayed = isPayedOrderState.value()
val timerTs = timerTsState.value()
// 1、create来了
if (i.eventType == “create”){
// 1.1 如果已经支付过了,那是正常支付完成,输出匹配成功的结果
if (isPayed){
isCreateOrderState.clear()
isPayedOrderState.clear()
timerTsState.clear()
context.timerService().deleteEventTimeTimer(timerTs)
collector.collect(OrderResult(context.getCurrentKey,“支付成功”))
}else{ //如果没有支付过,那注册一个定时器,等待15分钟后触发
context.timerService().registerEventTimeTimer(i.ts)
timerTsState.update(i.ts * 1000L + 900
1000L)
isCreateOrderState.update(true)
}
}
else if(i.eventType == “pay”){ //如果当前事件是支付事件
if(isCreate){ //判读订单创建事件已经发生
if(i.ts * 1000L < timerTs){ // 创建订单到支付的时间在超时时间内,代表正常支付
collector.collect(OrderResult(context.getCurrentKey,“支付成功”))
}else{
context.output(orderTimeoutOutputTag, OrderResult(context.getCurrentKey,“已经支付,但是没有找到订单超时了”))
}
isCreateOrderState.clear()
isPayedOrderState.clear()
timerTsState.clear()
context.timerService().deleteEventTimeTimer(timerTs)
}else{ //如果没看到订单创建的事件,那就注册一个定时器等着
context.timerService().registerEventTimeTimer(i.ts)
isPayedOrderState.update(true)
timerTsState.update(i.ts)
}
}

}
}

上面实现了监测用户支付的情况,实际中还需要对支付后的账单跟第三方支付平台做一个实时对账功能
会涉及到2条源码交易数据流(支付和账单)的合流计算
这里模拟账单,所以需要准备一个数据ReceiptLog.csv
akdb3833,alipay,1611047619
akdb3832,wechat,1611049617
上代码: src/main/scala/com/mafei/orderPayMonitor/TxMatch.scala
/*
*

  • @author mafei
  • @date 2021/1/31
    */
    package com.mafei.orderPayMonitor

import com.mafei.orderPayMonitor.OrderTimeoutMonitor.getClass
import org.apache.flink.api.common.state.{ValueState, ValueStateDescriptor}
import org.apache.flink.streaming.api.TimeCharacteristic
import org.apache.flink.streaming.api.functions.co.CoProcessFunction
import org.apache.flink.streaming.api.scala.{OutputTag, StreamExecutionEnvironment, createTypeInformation}
import org.apache.flink.util.Collector

case class ReceiptEvent(orderId: String, payChannel:String, ts: Long)

object TxMatch {
def main(args: Array[String]): Unit = {
val env = StreamExecutionEnvironment.getExecutionEnvironment
env.setParallelism(1)
env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime)

// 1、从订单文件中读取数据
val resource = getClass.getResource("/OrderLog.csv")
val orderEventStream = env.readTextFile(resource.getPath)
  .map(d=>{
    val arr = d.split(",")
    OrderEvent(arr(0).toLong,arr(1),arr(2), arr(3).toLong)  //把数据读出来转换成想要的样例类类型
  }).assignAscendingTimestamps(_.ts * 1000L)  //指定ts字段
  .filter(_.eventType=="pay")
  .keyBy(_.txId) //按照交易id分组

// 2、从账单中读取数据
val receiptResource = getClass.getResource("/ReceiptLog.csv")
val receiptEventStream = env.readTextFile(receiptResource.getPath)
  .map(d=>{
    val arr = d.split(",")
    ReceiptEvent(arr(0),arr(1),arr(2).toLong)  //把数据读出来转换成想要的样例类类型
  }).assignAscendingTimestamps(_.ts * 1000L)  //指定ts字段
  .keyBy(_.orderId) //按照订单id分组

// 3、合并两条流,进行处理
val resultStream = orderEventStream.connect(receiptEventStream)
  .process(new TxPayMatchResult())
resultStream.print("match: ")

resultStream.getSideOutput(new OutputTag[OrderEvent]("unmatched-pay")).print("unmatched-pay")
resultStream.getSideOutput(new OutputTag[ReceiptEvent]("receipt")).print("unmatched-receipt")
env.execute()

}
}

class TxPayMatchResult() extends CoProcessFunction[OrderEvent,ReceiptEvent,(OrderEvent,ReceiptEvent)]{
lazy val orderEventState: ValueState[OrderEvent] = getRuntimeContext.getState(new ValueStateDescriptor[OrderEvent](“orderEvent”, classOf[OrderEvent]))
lazy val receiptEventState: ValueState[ReceiptEvent] = getRuntimeContext.getState(new ValueStateDescriptor[ReceiptEvent](“payEvent”, classOf[ReceiptEvent]))

// 定义自定义侧输出流
val unmatchedOrderEventTag = new OutputTag[OrderEvent]
val unmatchedReceiptEventTag = new OutputTag[ReceiptEvent]
override def processElement1(in1: OrderEvent, context: CoProcessFunction[OrderEvent, ReceiptEvent, (OrderEvent, ReceiptEvent)]#Context, collector: Collector[(OrderEvent, ReceiptEvent)]): Unit = {
//判断支付账单来了
val receiptEvent = receiptEventState.value()
if(receiptEvent != null){
//如果账单已经过来了,那直接输出
collector.collect((in1,receiptEvent))
orderEventState.clear()
receiptEventState.clear()
}else{
//如果没来,那就注册一个定时器,等待10秒钟
context.timerService().registerEventTimeTimer(in1.ts*1000L + 10000L)
orderEventState.update(in1)
}
}

override def processElement2(in2: ReceiptEvent, context: CoProcessFunction[OrderEvent, ReceiptEvent, (OrderEvent, ReceiptEvent)]#Context, collector: Collector[(OrderEvent, ReceiptEvent)]): Unit = {
//判断支付事件来了
val orderEvent = orderEventState.value()
if(orderEvent != null){
//如果账单已经过来了,那直接输出
collector.collect((orderEvent,in2))
orderEventState.clear()
receiptEventState.clear()
}else{
//如果没来,那就注册一个定时器,等待2秒钟
context.timerService().registerEventTimeTimer(in2.ts*1000L + 2000L)
receiptEventState.update(in2)
}
}

override def onTimer(timestamp: Long, ctx: CoProcessFunction[OrderEvent, ReceiptEvent, (OrderEvent, ReceiptEvent)]#OnTimerContext, out: Collector[(OrderEvent, ReceiptEvent)]): Unit = {

if(orderEventState.value() != null){
  ctx.output(unmatchedOrderEventTag, orderEventState.value())
}
else if(receiptEventState.value() != null){
  ctx.output(unmatchedReceiptEventTag, receiptEventState.value())
}

orderEventState.clear()
receiptEventState.clear()

}
}
第二种, 使用join来实现这个效果
这种方式优点是跟方便了,做了一层封装,缺点也很明显如果要实现一些复杂情况如没匹配中的也输出之类的就不行了,具体看实际场景需要
/*
*

  • @author mafei
  • @date 2021/1/31
    */
    package com.mafei.orderPayMonitor

import com.mafei.orderPayMonitor.TxMatch.getClass
import org.apache.flink.streaming.api.TimeCharacteristic
import org.apache.flink.streaming.api.functions.co.ProcessJoinFunction
import org.apache.flink.streaming.api.scala.{StreamExecutionEnvironment, createTypeInformation}
import org.apache.flink.streaming.api.windowing.time.Time
import org.apache.flink.util.Collector

object TxMatchWithJoin {
def main(args: Array[String]): Unit = {
val env = StreamExecutionEnvironment.getExecutionEnvironment
env.setParallelism(1)
env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime)

// 1、从订单文件中读取数据
val resource = getClass.getResource("/OrderLog.csv")
val orderEventStream = env.readTextFile(resource.getPath)
  .map(d=>{
    val arr = d.split(",")
    OrderEvent(arr(0).toLong,arr(1),arr(2), arr(3).toLong)  //把数据读出来转换成想要的样例类类型
  }).assignAscendingTimestamps(_.ts * 1000L)  //指定ts字段
  .filter(_.eventType=="pay")
  .keyBy(_.txId) //按照交易id分组
// 2、从账单中读取数据
val receiptResource = getClass.getResource("/ReceiptLog.csv")
val receiptEventStream = env.readTextFile(receiptResource.getPath)
  .map(d=>{
    val arr = d.split(",")
    ReceiptEvent(arr(0),arr(1),arr(2).toLong)  //把数据读出来转换成想要的样例类类型
  }).assignAscendingTimestamps(_.ts * 1000L)  //指定ts字段
  .keyBy(_.orderId) //按照订单id分组
val resultStream = orderEventStream.intervalJoin(receiptEventStream)
  .between(Time.seconds(-3), Time.seconds(5))
  .process(new TxMatchWithJoinResult())
resultStream.print()
env.execute()

}
}
class TxMatchWithJoinResult() extends ProcessJoinFunction[OrderEvent, ReceiptEvent,(OrderEvent,ReceiptEvent)]{
override def processElement(in1: OrderEvent, in2: ReceiptEvent, context: ProcessJoinFunction[OrderEvent, ReceiptEvent, (OrderEvent, ReceiptEvent)]#Context, collector: Collector[(OrderEvent, ReceiptEvent)]): Unit = {

collector.collect((in1,in2))

}
}

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
您好!对于使用Flink SQL将数据流写入文件系统,您可以通过以下步骤来实现: 1. 导入所需的依赖项 首先,您需要在您的项目中添加Flink SQL和所选文件系统的相关依赖项。例如,如果您想将数据写入HDFS文件系统,您需要添加相关的Hadoop依赖项。 2. 创建一个Flink StreamTableEnvironment 通过创建一个Flink StreamTableEnvironment,您可以使用Flink SQL来处理和操作流数据。 ```java StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); StreamTableEnvironment tableEnv = StreamTableEnvironment.create(env); ``` 3. 定义输入表和输出表 您需要定义一个输入表和一个输出表,以便在Flink SQL中引用它们。 ```java tableEnv.executeSql("CREATE TABLE inputTable (field1 INT, field2 STRING) WITH (...)"); tableEnv.executeSql("CREATE TABLE outputTable (field1 INT, field2 STRING) WITH (...)"); ``` 在上述代码中,您需要根据实际情况替换`WITH (...)`部分,并根据您的输入数据源和输出目标进行配置。 4. 将数据流写入输出表 使用Flink SQL的INSERT INTO语句,您可以将数据从输入表写入输出表。 ```java tableEnv.executeSql("INSERT INTO outputTable SELECT * FROM inputTable"); ``` 在上述代码中,我们使用SELECT *从输入表中选择所有字段,并将其插入输出表中。 5. 执行Flink程序 最后,使用`env.execute()`来触发Flink程序的执行。 ```java env.execute(); ``` 这将启动Flink作业并开始将数据流写入文件系统。 请注意,上述步骤是一个简单的示例,您需要根据实际情况进行适当的配置和调整。另外,根据您选择的文件系统,可能还需要进行额外的配置和设置。 希望以上信息对您有所帮助!如有任何进一步的问题,请随时提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值