Flink学习2:应用场景

目录:

 

1 三大应用场景

1.1 事件驱动型

事务驱动型:计算和存储是在同一个位置。

事件驱动型:计算和存储是独立分开的。具有状态的应用,从一个或多个事件流中读取事件,并做出反应(触发计算,状态更新等)

事务驱动模型

事件驱动是,会从远程的事务数据库中读写数据。事件驱动型应用是基于传统的应用进化而来的。

典型的事件驱动应用场景:

事件驱动应用的优势:

访问本地数据更快

 事件驱动型应用,因为是读取本地数据,所以只需考虑自己数据,不会涉及到其他系统的修改。

1.2 flink是如何支持事件驱动应用的:

事件处理很重要的一个能力就是,处理时间和状态。


 

 

 

其中flink的savepoint 是一个一致性的状态镜像,可以记录多个应用状态,来使得应用可以安全放心的升级和扩容,并且还可以开启多个应用,来完成A/B测试。

1.2 数据分析型应用

什么是数据分析型应用:

流式数据分析应用:

 把结果写到外部数据库,或者内部状态中

 然后,报表等数据分析应用,可以从外部数据库,或者内部状态读取:

典型的数据分析场景:

流式查询的优势:

1.实时数据分析,相对批量离线数据分析,延迟低

2.解决了批量离线数据处理中的边界问题

3.利用故障恢复机制,解决了批量离线作业的调度复杂问题(以及上下游依赖导致的上游作业失败,下游作业无法运行)

 

 

 1.2.1 flink是如何支持数据分析应用的

1.提供标准SQL接口,不管是查询静态数据集,还是实时数据集都是可以的。

另外还支持自定义UDF函数。

而且,如果需要进一步定制处理逻辑,还可以使用DataSetAPI和DataStreamAPI提供更底层方法

另外,Flink的Gelly库提供了更多的图计算的库。

 

 

 

 

1.3 数据流水线应用

流水线简介:相对于ETL作业,流水线应用更实时

 

并且可以实现对目录,文件等实时监控,一旦发生改变可以随时捕获。

 

流水线应用的典型场景:

流水线的优势:

 

flink是如何支持流水线应用场景的:

提供大量连接器:

支持以时间分区的方式,来写入文件

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值