09_Flume之Sink的Processors

阿浩_

已于 2023-04-15 20:52:39 修改

阅读量138

点赞数

分类专栏：大数据 Flume 数据采集文章标签： flume 大数据

于 2023-04-15 20:51:40 首次发布

本文链接：https://blog.csdn.net/weixin_40727028/article/details/130175143

版权

Flume 同时被 3 个专栏收录

20 篇文章 1 订阅

订阅专栏

大数据

17 篇文章 0 订阅

订阅专栏

数据采集

17 篇文章 0 订阅

订阅专栏

1. Sink Processor共有三种类型

类型
DefaultSinkProcessor	对应单个sink，发送至单个sink
LoadBalancingSinkProcessor	对应的是 Sink Group，可以实现负载均衡的能力
FailoverSinkProcessor	对应的是Sink Group，可以错误回复的功能

Sink 提供了分组功能，用于把多个 Sink 聚合为一组进行使用，内部提供了 SinkGroup 用来完成这个事情。Sink Processors可以使在Sink Group中所有sink具有负载均衡的能力，或者在一个sink失效后切换到另一个sink的fail over模式。默认的sink processor只接受一个sink，用户不一定非得创建sink group

DefaultSinkProcessor ：默认实现，用于单个 Sink 的场景使用。

FailoverSinkProcessor ：故障转移实现， failover机制维护一个sink优先级列表，保证有效事件可以被处理掉。

LoadBalancingSinkProcessor: load balancing sink processor给多个sinks之间提供负载均衡，它维护一个可用sink索引，它支持通过round_robin和random两种方法进行负载分配，默认的选择方式是round_type类型的，也可以通过配置文件进行更改。当被选择器被调用的时候，它不会屏蔽故障的sink，继续尝试访问每一个可用的sink，如果所有的sink都故障了，选择器则无法给sink传播数据。如果backoff被开启，则sink processor会屏蔽故障的sink，选择器会在一个给定的超时时间内移除它们，当超时时间完毕后，sink还是无法访问，则超时时间以指数方式增长。

例子：

a_stat_info.sinkgroups.sg_stat_info.sinks = k_stat_info_1 k_stat_info_2
a_stat_info.sinkgroups.sg_stat_info.processor.type = load_balance
a_stat_info.sinkgroups.sg_stat_info.processor.backoff = true
a_stat_info.sinkgroups.sg_stat_info.processor.selector = round_robin
a_stat_info.sinkgroups.sg_stat_info.processor.selector.maxTimeOut = 30000

阿浩_

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
09_Flume之Sink的Processors

当被选择器被调用的时候，它不会屏蔽故障的sink，继续尝试访问每一个可用的sink，如果所有的sink都故障了，选择器则无法给sink传播数据。如果backoff被开启，则sink processor会屏蔽故障的sink，选择器会在一个给定的超时时间内移除它们，当超时时间完毕后，sink还是无法访问，则超时时间以指数方式增长。Sink Processors可以使在Sink Group中所有sink具有负载均衡的能力，或者在一个sink失效后切换到另一个sink的fail over模式。
复制链接

扫一扫

专栏目录