20240901 大数据流式计算 - SPRAK3.5与FLINK1.19(入门)

简要对比

spark structured stream

Structured Streaming Programming Guide - Spark 3.5.1 Documentation

flink

Apache Flink Documentation | Apache Flink
Apache Flink CDC | Apache Flink CDC
 

source file source API: readStream.format("csv")... flink SQL
source kafka source API: readStreammWriter.format("kafka")... flink SQL
source redis sourcek API: readStream.format("redis")... 没有基于stream;可以做batch/dim表https://github.com/jeff-zou/flink-connector-redis
source jdbc source N/A flink SQL CDC

spark structured stream flink
sink file
sdf.writeStream.format(...)
append
append
sink kafka
kafka upsert
sdf.writeStream.format(...)
Append, 
Update,
Complete
(at-least-once)
相当于没有主键的K,V表;
所有mode,都是insert into
基于SQL语义自动判断:
1. 当simple source to sink ETL, append mode, 可以写KAFKA
2. 当agg, 有update语义,可以写upsert-kafka
sink redis sink 支持A,U,C; 但需要通过foreach自定义实现(间接调用普通的df.write)

source:基于redis v5+, stream api (xadd,xread)
sink: foreachBatch,基于hset hget
没有基于stream;可以做batch/dim表h
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值