日志收集===》ELK、EFK、zookeeper+kafka

最新推荐文章于 2024-07-17 16:48:48 发布

一夜暴富--gogogo

最新推荐文章于 2024-07-17 16:48:48 发布

阅读量610

点赞数

分类专栏： Linux日志收集文章标签： kafka

本文链接：https://blog.csdn.net/weixin_52492280/article/details/118187082

版权

Linux日志收集专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1.架构图

简版：
位于各个节点上的filebeat将收集到的日志数据output给es存储，通过kibana展示。
在这里插入图片描述

规范版：适用于每天50G以上日志量收集。
位于各个节点上的filebeat先将数据/日志传递给Kafka（或者Redis），并将队列中消息或数据间接传递给Logstash，Logstash过滤、分析后将数据传递给Elasticsearch存储。最后由Kibana将日志和数据呈现给用户。因为引入了Kafka（或者Redis）,所以即使远端Logstash server因故障停止运行，数据将会先被存储下来，从而避免数据丢失。
在这里插入图片描述

2.单个服务介绍

1.Elasticsearch是个开源分布式搜索引擎，提供搜集、分析、存储数据三大功能。它的特点有：分布式，零配置，自动发现，索引自动分片，索引副本机制，restful风格接口，多数据源，自动搜索负载等。

2.Logstash 主要是用来日志的搜集、分析、过滤日志的工具，支持大量的数据获取方式。一般工作方式为c/s架构，client端安装在需要收集日志的主机上，server端负责将收到的各节点日志进行过滤、修改等操作在一并发往elasticsearch上去。缺点：Logstash耗资源较大，运行占用CPU和内存高。另外没有消息队列缓存，存在数据丢失隐患。

3.Kibana 也是一个开源和免费的工具，Kibana可以为 Logstash 和 ElasticSearch 提供的日志分析友好的 Web 界面，可以帮助汇总、分析和搜索重要数据日志。

4.Filebeat隶属于Beats。轻量，可代替Logstash，规避了Logstash的缺点，目前Beats包含四种工具：

Packetbeat（搜集网络流量数据）
Topbeat（搜集系统、进程和文件系统级别的 CPU 和内存使用情况等数据）
Filebeat（搜集文件数据）
Winlogbeat（搜集 Windows 事件日志数据）

5.filebeat工作原理：Filebeat由两个主要组件组成：prospectors 和 harvesters。这两个组件协同工作将文件变动发送到指定的输出中。
在这里插入图片描述

组件组成：

Prospector–探测–（探测有哪些文件可采集）
Harvest–收取–（具体采集文件数据）
libeat–汇集对外输送–（输出文件数据）
registry–记录收取进度–（记录采集和输出进度）

Prospector（勘测者）：负责管理Harvester并找到所有读取源。

Prospector会找到配置文件paths指定目录下的所有info.log文件，并为每个文件启动一个Harvester。Prospector会检查每个文件，看Harvester是否已经启动，是否需要启动，或者文件是否可以忽略。若Harvester关闭，只有在文件大小发生变化的时候Prospector才会执行检查。只能检测本地的文件。

Harvester（收割机）：