Java 条件解析,通过应用条件解析日志文件

最新推荐文章于 2024-07-19 10:21:01 发布

山羊也爱吃草莓

最新推荐文章于 2024-07-19 10:21:01 发布

阅读量111

点赞数

Java 条件解析

用python，怎么样：

#!/usr/bin/python

import re

text = open("logfile", "r").read()

regex = r'start (.+?)$.*?Final output is (.+?)(?:(?=\nDEBUG)|\Z)'

for m in re.finditer(regex, text, re.MULTILINE|re.DOTALL):

for i in m.groups():

print(i.replace('\n', ' '))

输入日志文件：

DEBUG: Fri Dec 7 06:49:14 2018:16920 extra text

DEBUG: Fri Dec 7 06:49:14 2018:16920: start

DEBUG: Fri Dec 7 06:49:14 2018:16920: Final output is "output

output output

output"

DEBUG: extra lines

DEBUG: Fri Dec 7 06:49:14 2018:16920 extra text

DEBUG: Fri Dec 7 06:49:14 2018:16920: start

DEBUG: Fri Dec 7 06:49:14 2018:16920: Final output is "output2

output+ output/

output2"

并输出：

"output output output output"

"output2 output+ output/ output2"

正则表达式中的第一个parens捕获 start 之后和换行符之前的所有字符并将字符串存储到 1st group 中 .

正则表达式中的第二个parens还捕获 Final output is 之后和 DEBUG 之前的任何字符或字符串的结尾并将字符串存储到 2nd group . 由于 re.DOTALL 选项，字符串中可以包含换行符 .

第3个parens是空长锚并且不包含在捕获组中 .

EDIT

下面的更新版本为单个ID处理多个“最终输出”，并仅显示每个ID的最后一个输出：

#!/usr/bin/python

import re

text = open("logfile", "r").read()

regex = r'start (.+?)$(.+?)(?:(?=DEBUG[^\n]+?start)|\Z)+'

regex2 = r'Final output is (.+?)(?:(?=\nDEBUG)|\Z)'

for m in re.finditer(regex, text, re.MULTILINE|re.DOTALL):

print m.group(1)

m2 = re.finditer(regex2, m.group(2), re.MULTILINE|re.DOTALL)

print list(m2).pop().group(1).replace('\n', ' ')

输入日志文件：

DEBUG: Fri Dec 7 06:49:14 2018:16920 extra text

DEBUG: Fri Dec 7 06:49:14 2018:16920: start

DEBUG: Fri Dec 7 06:49:14 2018:16920: Final output is "output

output output

output"

DEBUG: extra lines

DEBUG: Fri Dec 7 06:49:14 2018:16920: Final output is "this

is the last output

for "

DEBUG: extra lines

DEBUG: Fri Dec 7 06:49:14 2018:16920 extra text

DEBUG: Fri Dec 7 06:49:14 2018:16920: start

DEBUG: Fri Dec 7 06:49:14 2018:16920: Final output is "output2

output+ output/

output2"

并输出：

"this is the last output for "

"output2 output+ output/ output2"

我把子串的提取分为两个步骤：

提取ID和剩余文本(可能包含额外的字符串) . 这是使用 regex 处理的 .

从上面的"remaining text"中提取"final output"个子串 . 这是使用 regex2 处理的 .

然后选择最后的“最终输出”并显示 .

山羊也爱吃草莓

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。