随着近些年大数据技术的不断发展和成熟,无论是传统企业还是互联网公司都已经不再仅仅满足于批处理,对流处理的场景和需求也越来越强烈。于是业界也一直在探索统一流处理和批处理的引擎和 API,比如近几年火爆的 Spark,Beam,还有 Flink。阿里巴巴自 2015 年就开始改进 Flink,并创建了内部分支 Blink,目前服务了阿里集团内部搜索、推荐、广告和蚂蚁等大量核心实时业务。Blink SQL 和 Table API (java/scala 版的类 SQL API)是一套基于 Blink 引擎打造的可以同时支持流处理和批处理的统一的 API。
本文介绍了阿里巴巴当前 Blink SQL 丰富的功能,底层实现的原理,并且讲解流与表是如何相互转换的。目前阿里巴巴已经将大部分 Blink 和 Blink SQL 的改进贡献回 Flink 社区。本次分享会主要介绍了阿里巴巴对 Flink SQL 的各项贡献和改进,并向大家分享 Blink SQL 在阿里内部的大规模应用场景。
下面是完整PPT:(点击下面 阅读原文 链接获取本文PPT)
PPT下载:http://cdn.iteblog.com/59e826310ad3b.pdf
https://www.iteblog.com/59e826310ad3b.pdf
欢迎关注本公众号:iteblog_hadoop:
0、回复 电子书 获取 本站所有可下载的电子书
1、SparkRDMA:使用RDMA技术提升Spark的Shuffle性能
2、Hadoop 3.0磁盘均衡器(diskbalancer)新功能及使用介绍
5、Apache Spark 黑名单(Blacklist)机制介绍
10、Apache Flink 1.3.0正式发布及其新功能介绍
11、更多大数据文章欢迎访问https://www.iteblog.com及本公众号(iteblog_hadoop) 12、Flink中文文档:http://flink.iteblog.com