flink入门-01-Flink 流处理简介

1、Flink 是什么

 

Flink 的全球热度

 

Flink 目前在国内企业的应用

 

2、为什么要用 Flink

• 流数据更真实地反映了我们的生活方式

• 传统的数据架构是基于有限数据集的

• 我们的目标

➢ 低延迟

➢ 高吞吐

➢ 结果的准确性和良好的容错性

哪些行业需要处理流数据

• 电商和市场营销

➢ 数据报表、广告投放、业务流程需要

• 物联网(IOT)

➢ 传感器实时数据采集和显示、实时报警,交通运输业

• 电信业

➢ 基站流量调配

• 银行和金融业

➢ 实时结算和通知推送,实时检测异常行为

3、流处理的发展和演变

传统数据处理架构

 

 

 

流处理的演变

 

 

4、Flink 的主要特点

4.1 事件驱动(Event-driven)

 

4.2 基于流的世界观

在 Flink 的世界观中,一切都是由组成的,离线数据有界的流;实时数据是一个没有界限的流:这就是所谓

有界流无界流

 

4.3 分层API

➢ 越顶层越抽象,表达含义越简明,使用越方便

➢ 越底层越具体,表达能力越丰富,使用越灵活

 

4.4 其它特点

➢ 支持事件时间(event-time)和处理时间(processing-time)语义

➢精确一次(exactly-once)的状态一致性保证

➢低延迟,每秒处理数百万个事件,毫秒级延迟

➢与众多常用存储系统的连接

➢高可用,动态扩展,实现7*24小时全天候运行

5、Flink vs Spark Streaming

5.1 流(stream)和微批(micro-batching)

 

5.2 数据模型

– spark 采用 RDD 模型,spark streaming 的 DStream 实际上也就是一组 组小批 数据 RDD 的集合

– flink 基本数据模型是数据流,以及事件(Event)序列

5.3 运行时架构

– spark 是批计算,将 DAG 划分为不同的** stage**,一个完成后才可以计算下一个

– flink 是标准的流执行模式,一个事件在一个节点处理完后可以直接发往下一个节 点进行处理

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

步道师就是我

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值