ELK太重？试试KFC日志采集，操作系统面试题总结

最新推荐文章于 2024-07-24 12:32:39 发布

程序员伏地魔

最新推荐文章于 2024-07-24 12:32:39 发布

阅读量984

点赞数 21

分类专栏：程序员文章标签： elk

本文链接：https://blog.csdn.net/m0_56604447/article/details/137031092

版权

程序员专栏收录该内容

395 篇文章 0 订阅

订阅专栏

本文详细介绍了如何配置Filebeat采集日志，包括设置多行模式、字段映射、Kafka输出、以及与Clickhouse的集成，展示了如何处理和输出数据到不同目标系统，以满足监控和分析需求。

摘要由CSDN通过智能技术生成

event.Put(“log_class”,sp.slice(4,5).join(" "));

event.Put(“log_execTime”,“-1”);

event.Put(“log_message”,sp.slice(6).join(" "));

}

return;

}

event.Cancel();

}

drop_fields:

fields: [“@timestamp”, “message”, “host”, “ecs”, “agent”, “@metadata”, “log”, “input”]

复制代码

以上的配置说明：

max_procs：设置可以同时执行的最大CPU数；

queue :内部队列信息；

Filebeat inputs：日志数据源采集的入口；

其他字段如下说明：

复制代码

#日志类型

type: log

#开启

enabled: true

#编码格式，有中文必须设置

encoding: GB2312

#路径

paths:

D:/IIS/www.A.com/logs/*.txt

#多行匹配前缀

multiline.pattern: ‘^\d{4}-\d{1,2}-\d{1,2}’

#开启多行匹配

multiline.negate: true

#开启多行之后，匹配是合并到上一条信息

multiline.match: after

#增加一个字段，用于kafka的topic的识别

fields:

topic: ‘dlbZcZGBSyslogs’

字段增加在输出json的根目录下

fields_under_root: true

//https://www.cnblogs.com/EminemJK/p/15165961.html

复制代码

Kafka Output：kafka的配置信息，主要是 topic: ‘%{[topic]}’ 的设置，因为这里采集多个数据源，对于不同的topic，在数据源输入的时候，已经设置好字段如 topic: ‘dlbZcZGBSyslogs’ ，所以此处使用占位符灵活设置；

Processors：配置处理器，即对采集的日志信息进行处理，处理是按行处理，当字符串处理即可，可以使用js语法进行对字符串进行处理；Filebeat的处理器可以多种多样，具体可以看文档。

另外，在调试的时候，可以采用文件输出或Console输出来观察处理后输出的数据格式，再进行微调：

output.file:

path: “D:/bigData”

filename: filebeat.log

IIS的日志也差不多，只是微调处理逻辑就可以了，一通百通。

其他配置可以参考官网文档：h__ttps://www.elastic.co/guide/en/beats/filebeat/current/index.html

Kafka配置

Kafka没有特别的处理，在这里只是进行消息的接收，新建好主题就可以。

复制代码

//个人系统

bin/kafka-topics.sh --create --zookeeper 192.168.1.10:2181 --replication-factor 1 --partitions 3 --topic dlbZcMySyslogs

//单位系统

bin/kafka-topics.sh --create --zookeeper 192.168.1.10:2181 --replication-factor 1 --partitions 3 --topic dlbZcDWSyslogs

//管理系统

bin/kafka-topics.sh --create --zookeeper 192.168.1.10:2181 --replication-factor 1 --partitions 3 --topic dlbZcZGBSyslogs

复制代码

partitions 分区数的大小，取决设置了多少个消费者，这里我们有三台服务器做了Clickhouse的集群作为消费者，所以分区数设置为3，一般情况，消费者总数不应该大于分区数，每个分区只能分配一个消费者。

Clickhouse配置

Clickhouse三个分片的集群，如果你是单机的，只需要把语法相应的修改一下即可。

在每台服务器上创建kafka引擎表：

复制代码

CREATE TABLE kafka_dlb_ZC_My_syslogs (

log_datetime DateTime64,

log_index String,

log_level String,

log_class String,

log_message String,

log_execTime Float32,

server String

) ENGINE = Kafka

SETTINGS kafka_broker_list = ‘192.168.1.10:9092’,

kafka_topic_list = ‘dlbZcMySyslogs’,

kafka_group_name = ‘dlbZcMySyslogs_sys’,

kafka_format = ‘JSONEachRow’,

kafka_num_consumers = 1;

复制代码

创建实体表：

复制代码

CREATE TABLE dlb_ZC_My_syslogs on cluster cluster_3s_1r

(

log_datetime DateTime64,

log_index String,

log_level String,

log_class String,

log_message String,

log_execTime Float32,

server String

) ENGINE = ReplicatedMergeTree(‘/clickhouse/tables/{layer}-{shard}/dlb_ZC_My_syslogs’, ‘{replica}’)

ORDER BY toDate(log_datetime)

PARTITION BY toYYYYMM(log_datetime);

//https://www.cnblogs.com/EminemJK/p/15165961.html

复制代码

实体表是使用集群来创建的，如果是单机请删除 on cluster cluster_3s_1r ，修改表引擎即可。如果已经开启了zookeeper且开启复制表，在任一一台服务器运行运行一次即可。

在每台服务器上创建物化视图：

CREATE MATERIALIZED VIEW viem_dlb_ZC_My_syslogs_consumer TO dlb_ZC_My_syslogs

AS SELECT *

FROM kafka_dlb_ZC_My_syslogs;

创建分布式视图（可选，单机请忽略）：

CREATE TABLE Dis_dlb_ZC_My_syslogs ON CLUSTER cluster_3s_1r

AS LogsDataBase.dlb_ZC_My_syslogs

ENGINE = Distributed(cluster_3s_1r, ‘LogsDataBase’, ‘dlb_ZC_My_syslogs’,rand());

分布式表将聚合集群中每个分片的表信息，进行执行一次。

运行

–

顺便提供一个快速运行Filebeat和卸载的bat脚本：

运行服务：

复制代码

//windows server2008以上版本的服务器

cd %~dp0

.\install-service-filebeat.ps1

pause

//windows server 2008 和以下的服务器

cd %~dp0

PowerShell.exe -ExecutionPolicy RemoteSigned -File .\install-service-filebeat.ps1

pause

复制代码

卸载服务：

复制代码

//windows server2008以上版本的服务器

cd %~dp0

.\uninstall-service-filebeat.ps1

pause

//windows server2008和以下版本的服务器

cd %~dp0

PowerShell.exe -ExecutionPolicy RemoteSigned -File .\uninstall-service-filebeat.ps1

pausehttps://www.cnblogs.com/zhiganglang/p/15167152.html

小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。

深知大多数初中级Java工程师，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新Java开发全套学习资料》送给大家，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。

由于文件比较大，这里只是将部分目录截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频

如果你觉得这些内容对你有帮助，可以添加下面V无偿领取！（备注Java）

Ending

Tip：由于文章篇幅有限制，下面还有20个关于MySQL的问题，我都复盘整理成一份pdf文档了，后面的内容我就把剩下的问题的目录展示给大家看一下

如果觉得有帮助不妨【转发+点赞+关注】支持我，后续会为大家带来更多的技术类文章以及学习类文章！（阿里对MySQL底层实现以及索引实现问的很多）

吃透后这份pdf，你同样可以跟面试官侃侃而谈MySQL。其实像阿里p7岗位的需求也没那么难（但也不简单），扎实的Java基础+无短板知识面+对某几个开源技术有深度学习+阅读过源码+算法刷题，这一套下来p7岗差不多没什么问题，还是希望大家都能拿到高薪offer吧。

gCG7PgZd-1711391646500)]

Ending

Tip：由于文章篇幅有限制，下面还有20个关于MySQL的问题，我都复盘整理成一份pdf文档了，后面的内容我就把剩下的问题的目录展示给大家看一下

[外链图片转存中…(img-OJPypBON-1711391646500)]

[外链图片转存中…(img-yUAZcn8I-1711391646500)]

本文已被CODING开源项目：【一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码】收录

程序员伏地魔

关注

21
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
ELK太重？试试KFC日志采集，操作系统面试题总结

return;以上的配置说明：max_procs：设置可以同时执行的最大CPU数；queue :内部队列信息；Filebeat inputs：日志数据源采集的入口；
复制链接

扫一扫

专栏目录