个人的一些感悟:
今天是一个激动人心的时刻,阿里巴巴正式向Flink贡献了Blink的源码,这就意味着我们可以体验Blink的新功能了,阿里也一再强调Blink永远不会单独成为一个独立的开源项目来运作,他一定是Flink的一部分。后面Blink应该会和Flink主干的代码进行合并,也就是说以后只有Flink了,这样我们使用起来也比较的统一,但是具体需要合并多长时间还不确定,虽然阿里表示会很快的进行合并,但是我感觉时间应该会比较长,而且合并也会有一定的难度,因为这次宣布Blink的开源并且要和Flink的主干合并是阿里宣布的,而不是社区宣布的,所以总感觉有点喧宾夺主的意思,而且Blink的代码改动太大,真合并起来并不是一件容易的事.后面我也会带来Blink的一些相关体验.
本次开源的Blink代码在Flink 1.5.1版本之上,加入了大量的新功能,以及在性能和稳定性上的各种优化。主要贡献包括,阿里巴巴在流计算上积累的一些新功能和性能的优化,一套完整的(能够跑通全部TPC-H/TPC-DS,能够读取Hive meta和data)高性能Batch SQL,以及一些以提升易用性为主的功能(包括支持更高效的interactive programming, 与zeppelin更紧密的结合, 以及体验和性能更佳的Flink web)。未来我们还将继续给Flink贡献在AI,IoT以及其他新领域的功能和优化。
个人认为Flink作为新一代的流计算引擎,在流计算方面确实有很大的优势,或者说做的很好,但是在批处理和SQL方面spark目前还是有优势的,而且spark现在已经将重心转移到机器学习,深度学习和AI方面了,已经不是特别关系流处理,批处理.