什么是 Flink (流处理框架)

Flink 入门

在这里插入图片描述

什么是Flink


  • Apache Flink 是为分布式高性能、随时可用以及准确的流处理应用程序打造的开源流处理框架

  • Flink 官网

Flink 的发展历史d

    Flink 诞生于欧洲的一个大数据研究项目 StratoSphere。该项目是柏林工业大学的一个研究性项目。早期,Flink 是做 Batch 计算的,但是在 2014 年, StratoSphere 里面的核心成员孵化出 Flink,同年将 Flink 捐赠 Apache,并在后来成为 Apache 的顶级大数据项目,同时 Flink 计算的主流方向被定位为 Streaming,即用流式计算来做所有大数据的计算,这就是 Flink 技术诞生的背景。

  2014 年 Flink 作为主攻流计算的大数据引擎开始在开源大数据行业内崭露头角

Flink 与 Storm 及 Spark Streaming 等计算引擎的区别?


  • 1、Flink 是一个高吞吐低延迟计算引擎

  • 2、提供了有状态的计算,支持状态管理支持强一致性的数据语义

  • 3、支持基于Event Time的WaterMark对延迟乱序的数据进行处理等

大数据计算引擎发展


第一代: MapReducer

  • 批处理Mapper, Reducer
  • Hadoop的MapReducer将计算分为两个阶段, 分别为MapReducer

第二代: DAG框架 (Tez) + MapReducer

  • 批处理 1个Tez = MR (1) + MR (2) + … + MR (n) 相比MR效率有所提升

第三代: Spark

  • 批处理, 流处理, SQL高层API支持 自带DAG ,内存迭代计算, 性能较之前大幅提升

第四代: Flink

  • 批处理, 流处理, SQL高层API支持 自带DAG ,流式计算性能更高, 可靠性更高

Flink 的特点


图解

在这里插入图片描述

Flink 项目的理念

  • Apache Flink 是为分布式、高性能、随时可用以及准确的流处理应用程序打造的开源流处理框架

描述

  • Apache Flink 是一个框架分布式处理引擎,用于对无界有界数据流进行有状态计算。
  • Flink 被设计在所有常见的集群环境中运行,以内存执行速度任意规模来(流,批)执行计算。

Flink流处理的特点


1、同时支持高吞吐,低延迟,高性能

  • 低延迟状态保存内存中,很快计算完

2、支持事件时间(Event Time) 概念

  • Process TIme,大多数框架窗口计算采用的都是系统时间(process time),也是事件传输到计算框架处理时,系统主机的当前时间。
  • Event TimeFlink支持基于事件时间(Event Time)语义进行窗口计算,也就是使用事件产生的时间,这种基于事件驱动的机制使得事件即使乱序到达,系统也能够计算出精确的结果,保持了事件原本产生时的时序性,尽可能避免网络传输或硬件系统的影响。

3、支持有状态计算

4、支持高度灵活的窗口(Window)操作

  • Flink中除了滚动窗口滑动窗口还有基于数量的窗口Count基于会话的窗口Session

5、基于轻量级的分布式快照(CheckPoint)来实现容错

6、基于JVM实现独立的内存管理

7、Save Point保存点

  • CheckPoint自动的做容错
  • SavePoint手动的,处理程序升级

到底了。。。

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: Apache Flink是一个开源的处理框架。它具有高性能,可靠性和可扩展性,可用于处理实时数据和批量数据。 Flink支持多种编程模型,包括式计算和批处理,并具有内置的窗口和聚合功能。它还提供了对状态管理的支持,这对于处理时序数据和实现持久化的数据应用程序非常重要。 ### 回答2: Flink框架是一个用于大规模和批量数据处理的开源计算框架。它提供了高性能、可靠且灵活的处理大规模数据的方法。 Flink框架是基于原理上构建的一种数据处理框架,可以处理无界数据和有界批量数据。它具有低延迟和高吞吐量的特点,适用于需要实时处理数据的应用场景。 Flink框架的核心是其分布式式数据引擎。它支持以事件驱动方式处理数据,能够在数据到达时即时处理。同时,Flink还提供了丰富的操作符和函数库,使开发者能够方便地进行各种数据转换、聚合和计算。 Flink框架还提供了可靠性保证机制,如容错和恢复机制,确保数据处理的准确性和一致性。它能够处理各种数据来源,如文件、消息队列和数据库等,并能够将处理结果输出到不同的存储介质中。 Flink框架的特点还包括易用性和可扩展性。它提供了丰富的API和开发工具,使开发者能够迅速上手并快速实现特定的数据处理逻辑。同时,Flink框架支持水平扩展,可以在需要处理更多数据时简单地添加更多的计算节点。 总之,Flink框架是一个功能强大且灵活的数据处理框架,适用于各种大规模数据处理场景,能够高效地处理实时和批量数据,并提供可靠性和可扩展性保障。 ### 回答3: Flink框架是一个用于大规模处理和批处理的开源计算引擎。它是Apache软件基金会的一个顶级项目,旨在提供高效、可靠和可扩展的数据处理解决方案。 Flink以事件驱动的方式处理无界和有界数据。它支持精确一次处理和事件时间处理,并提供丰富的窗口操作来对数据进行分组聚合和转换。Flink还提供了丰富的库和API,以支持式SQL查询、图处理、机器学习等高级数据分析任务。 Flink的核心原理是分布式处理。它采用了式计算模型,将数据划分为无限的事件,并将其转化为有向无环图(DAG),以支持并行处理和容错恢复。Flink使用了预算性的数据传输机制,可以高效地处理各类数据,并通过检查点机制实现了容错能力。 Flink的优势在于其灵活性和性能。它能够处理实时和批处理数据,并且可以无缝地切换两种模式,以满足不同的需求。同时,Flink具有高吞吐量和低延迟的特点,能够处理大规模的数据集。 总之,Flink框架是一个功能强大的处理和批处理引擎,提供了灵活可靠的数据处理解决方案。它在大数据领域得到广泛应用,用于构建实时分析、事件驱动的应用程序和数据集的批处理任务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

寧三一

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值