大数据文摘出品
2015年,阿里搜索算法团队遇到了一个问题。
整个淘宝和天猫的商品都需要实时更新到在线的搜索和推荐引擎中,以及要根据用户在在线行为进行实时个性化的搜索排序和推荐。
在这样挑战的业务需求大背景下,阿里搜索团队迫切需要找到一个能承受巨大计算量并且实时化的计算引擎。
通过综合多方面因素的权衡和判断,阿里最终选择了Flink作为实时计算引擎。
之后也正如我们所见,阿里集团顶住了包括双十一、618等全年不断的大大小小促销活动。
作为一个14年才进入Apache的年轻项目,当时的Flink是如何吸引了阿里搜索团队的注意的呢?
阿里巴巴资深技术专家,实时计算负责人,也是Flink中文社区发起人王峰 (莫问)告诉我们,团队首先看中的是Flink的架构设计,尤其是作为一个纯流式思想来做大数据处理,不仅可以基于Kappa结构来做流式数据处理,还可以基于流为核心做批流融合的计算能力。
也正因如此,作为备受瞩目的新一代开源大数据计算引擎,Flink项目已成为Apache基金会和GitHub最为活跃的项目之一。在去年年底Flink Forward Asia 2019上透露,仅仅是2019年一年的时间,Flink在GitHub上的star数量就翻了一倍,贡献者数量也呈现出持续增长的态势。
为了让更多技术从业者了解Flink,Apache Flink Committer执笔,四位PMC成员审核,将Flink 9大技术版块详细拆分,突出重点内容并搭配全面的学习素材。
看完这份知识图谱,才算真的搞懂Flink!
▽ Flink 知识图谱概览 ▽
点击“阅读原文”或扫描文末二维码报名《开源Flink极客训练营》并加入配套钉钉群,即可马上下载高清版知识图谱,知识图谱PDF版本内含大量补充链接,一键点击即可查看相关扩展素材!
各版块知识点详解
-
Streaming Processing Concepts(common concepts for stream processing)
-
Architecture
-
State Management
-
DataStream
-
Libraries
-
Table API & SQL
-
Deployment and Operations
-
Debugging and Monitoring
-
Ecosystem
-
Use Cases
重磅福利:阿里大数据训练营重磅开启!
不过,一个人恶补“图谱”容易半途而废,配合这份知识图谱,文摘菌在这里也安利一波阿里下周开营的《开源技术Flink极客训练营》,0基础也能入门,7次课即刻快速上手。
课程目录如下👇
更重要的是,课程现在报名免费,名额有限,先到先得哦!
除了Flink,这次训练营还有8大课程供你挑选,从第一期实时计算Flink开始,到离线和实时一体化的数仓MaxCompute和Hologres,也包括开源大数据的全家桶,EMR、ElasticSearch,Flink,以及灵活的机器学习平台PAI和数据综合治理平台DataWorks。
每个训练营的课程时间3-7天不等,线上视频教学,总共超过40节课,覆盖大数据领域方方面面。
无论是你对数仓、数据湖、大数据建模,还是机器学习、搜索引擎以及其他的数据智能各种应用感兴趣,总会有一款适合你的训练营内容。
“大数据文摘”作为“九营齐开”计划的合作媒体,为读者们争取到了免费的参与名额,与行业一线团队和技术专家面对面交流。
除了直播课程和实战平台,每期训练营出品人将围绕某一核心技术及训练营直播课程规划课外阅读资料,提供从入门到上手的全套学习教材,保障实操演示与扩展阅读同步进行,让您免于“想自学没资料想实操没人教”的各种烦恼。
戳“阅读原文”立刻报名,你可以选择一个或者多个参与,报名免费,参与名额有限,文摘菌只能帮你到这里了!
最后,Flink社区知识图谱免费下载方式也来啦~点击“阅读原文”或扫描海报二维码,报名《开源Flink极客训练营》,并加入配套钉钉群,还有直播课程详解知识图谱的正确打开方式,让你一图在手,学好Flink不用愁!
知识图谱作者介绍:
程鹤群(军长),Apache Flink Committer,阿里巴巴技术专家,2015年4月加入阿里巴巴,从事主搜离线相关开发。2016年开始参与Flink SQL相关的研发。2018年开始核心参与Flink Table API相关的研发。