一、 前言
在elk架构方案中,最常用到的方案就是,由filebeat采集数据传送至kafka集群,再用logstash集群消费kafka集群中的数据。这里就简单的讲解一下,使用这套方案时,如何配置filebeat和logstash。
二、filebeat端的配置
在这里filebeat中input如何配置就不多做讲解,不懂的自行百度,下面就看一下filebeat对接kafka集群,必填的几个参数:
output.kafka:
enabled: true
hosts: ["192.168.23.76:9092","192.168.23.77:9092","192.168.23.78:9092"]
topic: beattest
hosts这里填写kafka集群的地址,这里不用多说,重点就一个,单个地址必须单独加引号(例如"192.168.23.76:9092")。
topic这里不也不多讲,大家都懂这是个什么玩意,让filebeat和logstash使用的topic一致即可。
三、 logstash端的配置
在logstash中input配置如下:
kafka{
bootstrap_servers => ["192.168.23.76:9092,192.168.23.77:9092,192.168.23.78:9092"]
group_id => "baicai"
auto_offset_reset => "earliest"
consumer_threads => "5"
decorate_events => "false"
topics => ["beattest"]
type => "bbs_log"
codec => json
}
这里需要注意的就四个地方
-
bootstrap_servers 也就是kafka集群的地址,在filebeat端要求单个地址加引号,这里是集群地址放一起加引号。
-
group_id 这里必须保证唯一,是你这个logstash集群消费kafka集群的身份标识。
-
topics filebeat和logstash使用的topic一致。
-
codec => json 由于beat传输数据给kafka集群的时候,会附加很多tag,默认情况下,logstash就会将这串tag也认为是message的一部分。这样不利于后期的数据处理。所有需要添加codec处理。得到原本的message数据。
四、如何使用logstash集群
根据上诉方法编写好logstash配置文件后,用n台logstash服务器运行即可。由于这个集群使用的是同一个groupid ,并不会出现logstash重复消费kafka集群的问题。
未经允许严禁转载,欢迎加入elk交流群探讨问题,群号:433418690