flume-kafka采集文件

flume-kafka采集文件

  • 启动zookeeper集群

    #在每一个节点上启动zookeeper
    /opt/apps/zookeeper/bin/zkServer.sh
    
  • 启动kafka集群2

    #在每一个节点上启动kafka -daemon后台启动
    /opt/apps/kafka/bin/kafka-server-start.sh -daemon /opt/apps/kafka/config/server.properties
    
  • 创建主题

    #--zookeeper 集群地址 -replication-factor 副本数 --partitions 分区数 --topic 追名称
    /opt/apps/kafka/bin/kafka-topics.sh --create --zookeeper mini1:2181 --replication-factor 2 --partitions 2 --topic test
    
  • 采集文件

    a1.sources=r1
    a1.sinks=k1
    a1.channels=c1
    
    
    ##############sources#############
    #数据源类型为exec,监控文件
    a1.sources.r1.type=exec
    #channel
    a1.sources.r1.channels=c1
    #命令通常为tail
    a1.sources.r1.command=tail -F /root/test.txt
    #是否重启命令
    a1.sources.r1.restart=true
    #重启时间间隔
    a1.sources.r1.restartThrottle=1000
    #最大存入channel数
    a1.sources.r1.batchSize=1000
    #存入最大等待时间
    a1.sources.r1.batchTimeout=1000
    #是否记录错误日志
    a1.sources.r1.logStdErr=true
    
    
    ##############channels#############
    #channel类型
    a1.channels.c1.type=memory
    #内存最大存储事件数
    a1.channels.c1.capacity=10000
    #sources每个事务存入的最大数,sink每次取到的最大数
    a1.channels.c1.transactionCapacity=1000
    #允许存储的最大字节数 128MB
    a1.channels.c1.byteCapacity=134217728
    #指定 Event header 所占空间大小与 channel 中所有 Event 的总大小之间的百分比
    a1.channels.c1.byteCapacityBufferPercentage=20
    #添加或删除一个event的超时时间
    a1.channels.c1.keep-alive=3
    
    
    ###############sinks##############
    #固定写法
    a1.sinks.k1.type=org.apache.flume.sink.kafka.KafkaSink
    #channle
    a1.sinks.k1.channel=c1
    #主题
    a1.sinks.k1.kafka.topic=test
    #kafka集群地址
    a1.sinks.k1.kafka.bootstrap.servers=mini1:9092
    #每次取的最大数
    a1.sinks.k1.kafka.flumeBatchSize=1000
    #1 leader应答就可以了,副本不需要
    a1.sinks.k1.kafka.producer.acks=1
    #大于0,批量存储。
    a1.sinks.k1.kafka.producer.linger.ms=1
    
    
  • 测试

    #创建消费者--bootstrap-server 集群地址   --topic主题名称
    /opt/apps/kafka/bin/kafka-console-consumer.sh --bootstrap-server mini1:9092 --topic test
    
    #启动flume采集
    flume-ng agent -n a1 -f /root/netcat-kafka.conf -Dflume.root.logger=INFO.console
    

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值