应运而生的 Flink
随着大数据时代的发展,我们对数据的时效性要求越来越高。比如金融交易、信号检测、地图导航等领域,都需要大量实时数据的传输。
为了满足这些实时场景的需求,Storm、Spark Streaming、Samza、MillWheel 等一众流处理技术开始走入大众视野,但是我们最熟悉的应该还是 Storm、Spark Steaming 和 Flink。
“高吞吐”、“低延迟” 和”exactly-once“是衡量一个流处理框架的重要指标。Storm 虽然提供了低延迟的流处理,但是在高吞吐方面的表现并不算佳,可以说基本满足不了日益暴涨的数据量要求;Spark Streaming 中通过微批次的批处理来模拟流处理,也实现了高吞吐和 exactly-once 语义,但受限于其实现方式,依然存在几秒的延迟,对于那些实时性要求较高的领域来说依然不够完美。
在这样的背景下,Flink 就应运而生了!
Flink 是什么?
Apache Flink 是为分布式、高性能、随时可用的流处理应用程序打造的开源流处理框架,用于对无界和有界数据流进行有状态计算。Flink 一词在德语中有着 “灵巧”、“快速” 的意思,它的 logo 原型也是柏林常见的一种松鼠,以身材娇小、灵活著称,为该项目选定这样的名字和 logo 也正好符合 Flink 的特点和愿景。
无论是架构设计,还是功能的完整性和易用性来讲,Flink 都名列前茅。目前,阿里巴巴、腾讯、美团、华为、滴滴出行、携程、饿了么、爱奇艺、有赞、唯品会等大厂都已经将 Flink 实践于公司大型项目中,带起了一波 Flink 风潮,势必也会让 Flink 人才市场产生供不应求的招聘现象。
11 个实验,入门 Flink
现在讲 Flink 的教程仍然比较少,中文资料更是缺乏。蓝桥云课新上线了一门 Flink 入门教程,通过 11 个实验带你快速上手,构建 Flink 知识体系。
本课程以文字 + 代码 + 配图的形式,紧紧结合 Flink 官方文档讲解 Flink 知识体系,内容涵盖环境搭建、架构理论以及 API 使用,各个实验环节紧密衔接、实验步骤先后有序、实验内容由浅入深,非常适合初学者。
课程没有长篇大论的理论知识,而是偏向于实战,带你在生产环境学习部署、运行、使用 Flink,以及如何排查和解决错误。课程每一节都提供了配套的实验环境,无需安装任何配置,随时随地打开浏览器就可以开始练习。
你将学到:
课程地址:
https://www.lanqiao.cn/courses/3423
课程大纲:
???????????? 点击文末的「阅读原文」,即可免费试学本课程~