flink启动命令参数_flink启动命令参数_基于Flink的实时数据仓库实践分享

本文分享了基于Flink的实时数据仓库实践,探讨了金融行业的实时风控场景,比较了Storm、Spark Streaming和Flink的特性。Flink的架构包括JobManager和TaskManager,其任务提交和处理过程涉及Akka Framework。文章还介绍了Flink在YARN上的集群部署流程,并展示了Flink作业的开发和运行步骤。
摘要由CSDN通过智能技术生成

4454b8bff8c2410381f9942029e67ff2.png

作者:沈午飞 目前就职于科技开发部创新中心 java和python编程技术方向 主要服务于数据中台。

2a8a15b7eeb1385a532252c4d49fa837.png

金融行业作为典型的流式计算应用领域,涵盖了包括用户行为分析、实时营销、个性化推荐、实时风控、实时反欺诈等多个计算场景。以实时金融风控场景为例,需要流式计算系统实时分析海量的用户行为数据,根据既定的规则计算出相应的指标,并与风险模型进行匹配,第一时间判断风险等级、发现异常事件,并作出相应的风险控制措施,自动告警通知、改变业务流程。

目前

主流的流式计算框架有三种,分别是Storm,Spark Streaming,Flink。其中 Storm属于典型的流式处理,低延迟,高吞吐,且每条数据都会触发实时计算。spark属于批处理转化为流处理即将流式数据根据时间切分成小批次进行计算,对比与storm而言延迟会高于0.5s(秒级延迟),但是性能上的消耗低于storm。flink为流式计算而生属于每一条数据触发计算,在性能的消耗低于storm,吞吐量高于storm,延时低于storm,并且比storm更加易于编写。

Flink的架构图如下:

e8bb568510a1ce72adc9bbd62c0821ae.png

架构概括:

JobManager(指挥者,JVM 进程):协调分布式执行安排任务,协调检查点,协调故障恢复;

TaskManager(干活的工人,一个对应一个 JVM 进程):执行任务的数据流,缓冲器以及交换数据流;

客户端:提交任务、任务交互(提交任务后就可以退选择退出);

所有组件之间的通信借助于 Akka Framework,包括任务状态、Checkpo

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值