填空题:
Yarn做资源调度时,maptask和reduce Task是运行在Container中。
Flume在传输数据过程中,可以对数据进行简单过滤,主要通过设置Interceptor在Soure和Channel之间对不关心的数据进行过滤。
HBase会周期性的把MemStore的数据刷写在磁盘StoreFile文件中
Redis主要消耗内存物理资源
下面那些场景不是Flink组件擅长的:迭代计算、数据存储
如果需要由数据生产者决定数据发送给目标Bolt的某一个确定的Task,应选择直接分组消息发布策略
ElasticSearch采用倒排索引方式索引数据