Filebeat 多行日志匹配处理

最新推荐文章于 2025-08-15 16:19:47 发布

yasewangyase

最新推荐文章于 2025-08-15 16:19:47 发布

阅读量3.7k

点赞数

CC 4.0 BY-SA版权

分类专栏： EFK 文章标签：运维

本文链接：https://blog.csdn.net/wangyanmm_/article/details/105600817

EFK 专栏收录该内容

6 篇文章

订阅专栏

在使用 Filebeat 采集 Tomcat 日志时，因为默认采集是按照行采集的，在统计的时候会不准确，因此采用 multiline 进行处理。

根据业务和日志级别情况，若日志级别是配成 ERROR ，只需要将错误日志进行合并处理，若日志级别低于 ERROR ，根据日志分析的要求，我这边会只将带有 ERROR 或者 WARN 的日志提取出来，就需要和 include_lines 、exclude_lines配合使用效果更佳。废话不多说，上配置。

Tomcat 日志格式，每行是以固定格式的日期开头，包括错误日志都是一样。

多行日志合并处理，multiline.pattern 是正则匹配格式；multiline.negate（取值 true 或 false）默认是false，匹配pattern的行合并到上一行；true，不匹配pattern的行合并到上一行； multiline.match（取值 after 或before）合并到上一行的末尾或开头。

当需要提取日志只包含固定词汇时，比如说是只包含 ERROR 和 WARN 的行会被提取

# 包含过滤字符
include_lines: ['ERROR', 'WARN'] 
# 不包含过滤字符
exclude_lines: ['DEBUG']

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

yasewangyase

关注关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Filebeat 关键字多行匹配日志采集（multiline与include_lines）

weixin_33824363的博客

06-23

2404

很多同事认为filebeat采集日志不能做到多行处理，今天这里讨论下filebeat的multiline与include_lines。先来个案例，以下日志，我们只要求采集error的字段，2017/06/2211:26:30[error]26067#0:*17918connect()failed(111:Connectionrefused)whilec...

Logstash -filebeat 6.5 多行日志合并

Beckham的博客

05-09

1660

日志内容： authenticatorClient: <82fa722c1abd2ee6effd39ac954f3927> loginMode: <2> timestamp: <509110741> version: <48> 2020-05-09 11:07:41.200 |INFO | SENT: status:

1 条评论您还未登录，请先登录后发表或查看评论

filebeat采集应用程序日志和多行匹配

qq_73797346的博客

01-02

1801

多行匹配官方文档为什么需要多行匹配，java程序报错很有特点，基本上看到行首连续出现的 at ，然后往上看就能快速定位问题。1.先看图。ES官方介绍了4种多行匹配模式描述：正则表达式匹配的行被视为前一行的延续或新多行事件的开始false如果设置为true：匹配到的行作为一个事件的开始，不匹配的行会参与到多行合并如果设置为false：匹配的行会参与到多行合并，反之不匹配的就作为一个事件的开始2.方式1的匹配模式示例：java报错采集提示：看懂官方的需要正则表达式基础示例图，正则匹配到的。

Filebeat 轻量级日志采集实践：安装、配置、多行合并、JSON 解析与字段处理

最新发布

m0_57194659的博客

08-15

1123

在现代分布式架构中，日志集中采集至关重要。Filebeat作为ELK轻量级采集器，广泛用于生产环境。本文基于8.2.2版本，系统讲解安装部署与核心配置，涵盖单行/多行日志采集、JSON解析、字段增强、日志过滤等实战场景，附完整示例，助力ELK新手与运维开发者高效构建日志体系。

GPIB_Code

混沌的博客

12-21

3793

Avoid unnecessary use of *RST. Putting Multiple Commands on the Same Line ; *OPC (operation complete) sets bit 0 in the standard event status register when all operations are complete. /*Set the a

Filebeat处理多行换行的问题

~O~

03-01

2016

fillbeat处理多行日志问题

【运维知识大神篇】超详细的ELFK日志分析教程8（filebeat多行匹配+filestream替换log类型+ES集群修复脚本+ES集群加密+角色访问控制+ES集群配置HTTPS加密）

吾日三省吾身，想出类拔萃，要把知识学牢，学全，学深，学广。

12-01

1848

本篇文章给大家介绍filebeat多行匹配、filestream替换log类型、ES集群修复脚本、ES集群加密、角色访问控制、ES集群配置HTTPS加密，kibana与ES集群加密传输，kibana的HTTPS加密等内容

filebeat多行合并配置文件.txt

01-03

### Filebeat多行合并配置详解 #### 一、概述在日志收集与处理领域，Filebeat是一款轻量级的日志转发工具，属于Elasticsearch生态中的重要组件之一。Filebeat能够有效地从服务器上采集日志文件，并将其发送至...

Filebeat新手入门（二）多行合并

kele5589的博客

05-09

3196

Filebeat 日志数据采集和分析

filebeat收集java程序多行报错

lt_xiaodou的博客

08-26

591

一个java程序报错往往是一个事件，这个报错并不是一行就能展示完的，几乎需要几十行才能展示完这个报错内容，对于filebeat来说，filebeat每次都是把一行看成了一个日志，那么对于java多行报错就不是很友好了，即使收集过来也是将一个事件的报错日志分成很多行在kibana上展示，这样对于开发人员来看日志就很头疼了如果对于多行报错的日志还用传统的收集方法，就像下图一样，完全不知道报错是什么了，不管谁看这个日志都需要去对比。...

log-pilot 多行日志收集

qq_21961907的博客

12-18

1622

log-pilot 有两种工具对日志进行收集 fluentd filebeat 我使用的是filebeat 对日志文件进行采集。为了更好的对java 的日志进行采集需要进行多行的日志收集公司java日志一般以"^[" 进行段落区分操作如下：拉取代码修改模板 git clone https://github.com/AliyunContainerService/log-pilot.git cd log-pilot vim assets/filebeat/filebeat.tpl 添加

Filebeat 行匹配

WGYHAPPY的博客

07-12

437

文章目录可用正则符号行匹配negate 和 match 的使用可用正则符号 regexp-support 行匹配 negate 和 match 的使用 ... multiline.pattern: '^\[[0-9]{4}-[0-9]{2}-[0-9]{2}' multiline.negate: true multiline.match: after ... negate 有对立面的意思。这个词是对相对前面的 mutiline.pattern 做解释的。比如官方的例子： multil

Filebeat 按照关键字匹配采集多行日志（实验详解）

BigManing的博客

08-10

3231

一、采集多行日志官方介绍 ### Multiline options # Multiline can be used for log messages spanning multiple lines. This is common # for Java Stack Traces or C-Line Continuation # The regexp Pattern that has to be matched. The example pattern matches all lines s

Filebeat合并多行消息

小熊的专栏

04-25

2408

Filebeat收集的文件可能包含跨越多行文本的消息。例如，多行消息在包含Java堆栈跟踪的文件中很常见。为了正确处理这些多行事件，您需要multiline在filebeat.yml文件中配置设置以指定哪些行是单个事件的一部分。如果要将多行事件发送到Logstash，请在将事件数据发送到Logstash之前，使用此处介绍的选项处理多行事件。尝试在Logstash中实现多行事件处理（例如，通过使用...

使用 Filebeat 对多行日志进行处理（multiline）

热门推荐

杂货铺子

11-09

1万+

Filebeat 收集日志的过程中，默认是按行收取的，也就是每一行都会默认是一个单独的事件并添加时间戳。但是在收集一些特殊日志的时候，往往一个事件包含有多行，例如 Java 的堆栈跟踪日志： 20-09-25 09:09:01.866 ERROR - {"traceId":"","where":{"methodName":"doFilter","className":"com.sohu.smc.channel.news.filter.ResponseTimeFilter","lineNumber":47},

filebeat 匹配测试

qq_35015663的博客

10-09

1103

【代码】filebeat 匹配测试。

ELK - filebeat - Multiline Configuration

chuckchen1222的博客

12-28

474

日志中出现多行，该如何跟踪。使用filebeat中的multiline配置，在日志跟踪的时候，直接 multiline.negate: 定义模式是否被否定。默认值是false。 multiline.match: 指定Filebeat如何将匹配行组合到事件中。设置是在后面或之前。 negate match result ...

filebeat合并多行日志

******* ▄︻┻┳═一 *******

10-30

7767

原文地址：https://www.elastic.co/guide/en/beats/filebeat/current/_examples_of_multiline_configuration.html 一、多行配置示例 1、将Java堆栈跟踪日志组合成一个事件 2、将C风格的日志组合成一个事件 3、结合时间戳处理多行事件二、Java堆栈跟踪 1、Java示例一 Java堆栈跟踪由多行组成，...

filebeat踩坑

weixin_34310369的博客

04-01

832

使用filebeat5.0.1版本，用filebeat作为日志收集工具时：java日志格式需要多行匹配，在filebeat配置文件中添加： ### Multiline options # Mutiline can be used for log messages spanning multiple lines. This is common # for Java Sta...

filebeat处理不了多行日志把

03-31

<think>嗯，用户问的是“filebeat处理不了多行日志把”，看起来是想确认Filebeat是否真的无法处理多行日志，或者是否有办法解决这个问题。用户之前可能在使用Fluentd作为Sidecar处理日志，现在可能在考虑替代方案，或者遇到了Filebeat处理多行日志的问题。首先，我需要回忆一下Filebeat的功能。Filebeat是Elastic Stack的一部分，主要用于轻量级的日志收集，通常用于将日志发送到Logstash或Elasticsearch。多行日志处理在应用日志中很常见，比如Java的堆栈跟踪，如果没有正确处理，这些多行事件会被拆分成多条日志条目，导致难以分析。然后，用户提到“处理不了多行日志”，这可能意味着他们在配置Filebeat时遇到了困难，或者听说Filebeat不支持多行处理。但根据我的知识，Filebeat其实支持多行日志的配置，通过multiline选项。可能用户没有正确配置，或者遇到了其他问题。接下来，我需要确认Filebeat的版本，不同版本的配置方式可能不同。例如，在较新的版本中，配置方式可能有所变化。用户可能在旧版本中尝试配置，或者文档中的示例不清晰，导致配置错误。另外，用户可能比较了Fluentd和Filebeat，觉得Fluentd处理多行日志更方便，而Filebeat较为复杂。这时候需要解释Filebeat如何处理多行日志，给出具体的配置示例，说明其优缺点，以及适用的场景。还需要考虑用户的实际使用环境。例如，他们的日志格式是什么样的，是否有多行日志的特定模式，比如以时间戳开头，或者特定的缩进。不同的日志格式需要不同的multiline配置，用户可能没有正确设置这些参数，导致处理失败。此外，用户可能对Filebeat的资源消耗和性能有顾虑，尤其是在Kubernetes环境中作为Sidecar运行。需要比较Filebeat和Fluentd在资源使用上的差异，帮助用户做出选择。最后，总结Filebeat处理多行日志的能力，并给出优化建议和替代方案，确保用户可以根据自己的需求选择最合适的工具。</think>以下是针对 **Filebeat 处理多行日志** 的详细解析，包括能力边界、配置方法与优化建议： --- ### 一、Filebeat 对多行日志的**基础支持能力** Filebeat **支持多行日志合并**，但需**显式配置**。关键点如下： 1. **适用场景** - Java/Python 等语言的异常堆栈（以空格或制表符开头） - 日志事件以特定标识符开头（如时间戳、日志级别） 2. **核心限制** - **无内置自动识别**：必须手动定义正则表达式匹配规则 - **跨文件合并不可行**：无法合并分散在不同文件中的关联日志 - **上下文关联弱**：仅支持基于**行首模式**的连续行合并 --- ### 二、Filebeat 多行日志**配置详解** #### 示例场景：Java 异常堆栈 ```yaml filebeat.inputs: - type: filestream paths: - /var/log/app/*.log multiline: type: pattern pattern: '^\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}' # 匹配时间戳开头的行 negate: true # 不符合 pattern 的行视为前一事件的延续 match: after # 合并到上一行之后 max_lines: 500 # 最大合并行数（防内存溢出） ``` #### 关键参数说明： | 参数 | 作用 | |--------------|----------------------------------------------------------------------| | `pattern` | 正则表达式，用于识别新日志事件的起始行 | | `negate` | `true` → 不符合 pattern 的行视为延续行；`false` → 符合 pattern 的为起始行 | | `match` | `after` 或 `before`，控制延续行的合并方向 | | `max_lines` | 单次合并的最大行数（默认 500，超出部分会拆分） | --- ### 三、Filebeat 多行处理**常见问题与解决方案** #### 问题 1：日志切割导致**事件不完整** - **现象**：应用正在写日志时 Filebeat 读取，导致事件被截断 - **解决方案**： ```yaml close_inactive: 5m # 5分钟内无新内容则关闭文件句柄 close_renamed: true # 文件重命名时（如日志轮转）立即关闭 clean_removed: true # 自动清理已删除文件的注册信息 ``` #### 问题 2：**复杂多行结构**解析失败 - **现象**：日志包含嵌套结构（如 JSON 内换行） - **解决方案**： ```yaml multiline: type: pattern pattern: '^{' # 以 JSON 起始大括号为事件起点 negate: true match: after parsers: # 结合 JSON 解析器 - ndjson: target: "" ``` --- ### 四、Filebeat vs Fluentd 多行处理**能力对比** | 特性 | Filebeat | Fluentd | |---------------------|----------------------------|------------------------| | **配置复杂度** | 中（需正则表达式） | 高（插件依赖） | | **内存占用** | 低（Go 语言优化） | 较高（Ruby 引擎） | | **实时性** | 高（轻量级设计） | 中（缓冲机制） | | **多文件关联** | 不支持 | 通过插件实现 | | **动态模式调整** | 需重启生效 | 可热加载配置 | --- ### 五、**进阶优化方案** #### 方案 1：Filebeat + Logstash 管道 ```mermaid graph LR A[App Log] --> B[Filebeat] B -->|合并基础多行| C[Logstash] C -->|复杂处理| D[Elasticsearch] ``` - **优势**：利用 Logstash 的 `multiline` 插件进行二次处理 - **Logstash 配置片段**： ```ruby filter { multiline { pattern => "^%{TIMESTAMP_ISO8601}" what => "previous" } } ``` #### 方案 2：Filebeat 自定义正则表达式针对特殊日志格式（如 Python Traceback）： ```yaml multiline: pattern: '^\s+(File|Traceback|Exception)' # 匹配 Python 错误缩进行 negate: true match: after ``` --- ### 结论 Filebeat **能够处理多行日志**，但需注意： 1. 明确日志的**起始行特征**，配置精准的正则表达式 2. 对复杂场景（如跨文件关联），建议结合 Logstash 或改用 Fluentd 3. 生产环境中务必设置 `max_lines` 和资源限制，避免内存溢出 **推荐选择策略**： - 简单多行结构 + 资源敏感场景 → **Filebeat** - 复杂嵌套日志 + 需动态处理 → **Fluentd**