橘子学Flink01之Flink的前世今生

一、Flink概述

1、Flink的前世今生

Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Flink被设计在所有常见的集群环境中运行,以内存执行速度和任意规模来执行计算。

  • Flink起源于2008年柏林理工大学的研究性项目Stratosphere,但是当时没有火起来,因为08年的时候对于流式计算没有那么大的需求。

  • 2014年该项目被捐赠给了Apache软件基金会,此时14年数据量激增,流式数据的计算对于生产就很有市场了。于是,Flink一跃成为Apache软件基金会的顶级项目之一
    Flink的Logo
    在这里插入图片描述
    Apache的Logo
    在这里插入图片描述
    在德语中,Flink一词表示快速和灵巧,项目采用一只松鼠的彩色图案作为logo,这不仅是因为松鼠具有快速和灵巧的特点,还因为柏林的松鼠有一种迷人的红棕色,而Flink的松鼠logo拥有可爱的尾巴,尾巴的颜色与Apache软件基金会的logo颜色相呼应,也就是说,这是一只Apache风格的松鼠。

2、什么是流式数据

我们看到了flink主要是计算方式是流式的处理数据,那何谓之流式数据。见名知义就是像水流一样的数据,源源不断的过来。我们看下官网的介绍。
[flink官网][https://flink.apache.org/flink-architecture.html]
在这里插入图片描述
我们看到官网的描述就是数据源源不断的从过去到现在到将来。

3、什么是计算

大数据课程都有这么一个例子,就是wordCount,简单描述一下就是:有这么一个文本,里面有一堆词汇。比如:
在这里插入图片描述
需求就是统计每个字出现的次数。就要分为三步走。
1、把词汇打散。
2、把相同的词汇聚一起。
3、统计每个汇聚集。
对于流式数据就是源源不断的数据过来,计算就是源源不断的数据过来flink做计算,突出一个厉害。

4、Flink的特点

Flink 是一个开源的流处理框架,它具有以下特点

  • 批流一体:统一批处理、流处理
  • 分布式:Flink程序可以运行在多台机器上
  • 高性能:处理性能比较高
  • 高可用:Flink支持高可用性(HA)
  • 准确:Flink可以保证数据处理的准确性

5、使用场景

Flink主要应用于流式数据分析场景

  • 实时ETL

    集成流计算现有的诸多数据通道和SQL灵活的加工能力,对流式数据进行实时清晰、归并和结构化处理;同时,对离线数仓进行有效的补充和优化,并为数据实时传输提供可计算通道。

  • 实时报表

    实时化采集、加工流式数据存储;实时监控和展现业务、客户各类指标,让数据化运营实时化。

  • 监控预警

    对系统和用户行为进行实时监测和分析,以便及时发现危险行为

  • 在线系统

    实时计算各类数据指标,并利用实时结果及时调整在线系统的相关策略,在各类内容投放、智能推送领域有大量的应用

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值