1、Apache Druid 和 Alibaba Druid是两个技术。
Apache Druid是一个为OLAP查询需求而设计的开源大数据系统,druid提供低延时的数据插入,实时的数据查询。简单说,就是一个数据库系统。有一个比其他数据库系统好的特性是,预聚合。可以做max等计算操作。这个是比传统关系型数据库强的地方。
Apache Druid简介:http://druid.apache.org/docs/latest/design/
Alibaba Druid是一个数据库连接池和数据源技术组件。
Alibaba Druid简介:https://github.com/alibaba/druid
2、Apache Flink:
并行度 和 checkpoint
在集群中,运算一个作业,如果30台机器可以刚好算完,那么并行度设置为32,如果集群中1台故障,可以通过checkpoint机制把空闲的1台及时顶上。
参考:
https://zhuanlan.zhihu.com/p/114454310
https://zhuanlan.zhihu.com/p/79526638?utm_source=wechat_session