Flume自定义Source

讲解一下如何自定义一个Flume的Source,很简单,下面是一个自定义Source,从Kafka中读取数据的Demo.

package death.flume;

import com.google.common.base.Preconditions;
import org.apache.flume.Context;
import org.apache.flume.EventDeliveryException;
import org.apache.flume.PollableSource;
import org.apache.flume.conf.Configurable;
import org.apache.flume.event.EventBuilder;
import org.apache.flume.source.AbstractSource;
import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;

import java.nio.charset.Charset;
import java.util.Collections;
import java.util.Properties;

// 继承AbstractSource抽象类,并实现Configurable接口
public class FlumeSourceDemo extends AbstractSource implements Configurable, PollableSource {

    private String KAFKA_SERVER;

    private String KAFKA_TOPIC;

    private String GROUP_ID;

    private String KEY_DES;

    private String VALUE_DES;

    private Properties props;

	// Source的数据处理逻辑
    @Override
    public Status process() throws EventDeliveryException {
        try {
                KafkaConsumer<String, String> consumer = new KafkaConsumer<String, String>(props);

                consumer.subscribe(Collections.singleton(KAFKA_TOPIC));

                ConsumerRecords<String, String> records = consumer.poll(1000);

                for (ConsumerRecord<String, String> record : records) {
                    System.out.println(record.value());
                    this.getChannelProcessor().processEvent(EventBuilder.withBody(record.value(), Charset.forName("UTF-8")));
                }
            return Status.READY;

        }catch (Exception e){
            e.printStackTrace();
            return Status.BACKOFF;
        }
    }

	//该方法用于Source的初始化
    @Override
    public void configure(Context context) {

        KAFKA_SERVER = context.getString("kafka_server");
        Preconditions.checkNotNull(KAFKA_SERVER, "kafka_server must be set");

        KAFKA_TOPIC = context.getString("kafka_topic");
        Preconditions.checkNotNull(KAFKA_TOPIC, "kafka_topic must be set");

        GROUP_ID = context.getString("group_id");
        Preconditions.checkNotNull(GROUP_ID, "group_id must be set");

        KEY_DES = context.getString("key_des");
        Preconditions.checkNotNull(KEY_DES, "key_des must be set");

        VALUE_DES = context.getString("value_des");
        Preconditions.checkNotNull(VALUE_DES, "value_des must be set");

    }

	// 该方法在Source启动时调用
    @Override
    public synchronized void start() {
        super.start();

        props = new Properties();
        props.setProperty("bootstrap.servers", KAFKA_SERVER);
        props.setProperty("group.id", GROUP_ID);
        props.setProperty("key.deserializer", KEY_DES);
        props.setProperty("value.deserializer", VALUE_DES);
    }

	// 该方法在Source停止时调用
    @Override
    public synchronized void stop() {
        super.stop();
    }
}

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Flume自定义Source实现PollableSource后,可以通过实现 `configure(Context context)` 方法来获取配置信息,然后在 `process()` 方法中控制采集间隔。 具体来说,可以在 `configure(Context context)` 方法中获取配置的采集间隔时间,然后将其转换成毫秒数,保存到一个变量中。然后在 `process()` 方法中,使用 `Thread.sleep()` 方法控制采集间隔时间。 以下是一个示例代码: ```java public class MySource extends AbstractPollableSource { private long pollInterval; @Override public void configure(Context context) { // 从配置文件中获取采集间隔时间,单位为秒 pollInterval = context.getLong("pollInterval", 60); pollInterval *= 1000; // 转换成毫秒数 } @Override protected Status doProcess() throws EventDeliveryException { try { // 采集数据 List<Event> events = pollData(); // 发送事件 getChannelProcessor().processEventBatch(events); // 控制采集间隔时间 Thread.sleep(pollInterval); return Status.READY; } catch (InterruptedException e) { return Status.BACKOFF; } } private List<Event> pollData() { // 采集数据的实现 // ... } } ``` 在上面的示例代码中,我们首先在 `configure(Context context)` 方法中获取配置的采集间隔时间,然后在 `process()` 方法中使用 `Thread.sleep()` 方法控制采集间隔时间。 需要注意的是,由于 `Thread.sleep()` 方法会阻塞当前线程,因此在 `process()` 方法中需要处理 `InterruptedException` 异常,并返回 `Status.BACKOFF` 以避免无限重试。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值