正则表达式

"该内容涉及正则表达式在日志报告解析中的应用,重点讲解了^和$的匹配作用,以及?P用于命名捕获组的功能。文中还详细解释了w、[w+]和[S+]的区别,并展示了如何使用re.compile()编译正则表达式实例。内容涵盖正则表达式的匹配规则和在信息技术场景下的具体运用。"
摘要由CSDN通过智能技术生成

End of Day Statistics Report Collection Date-Time 04/04/2016-00:00:00 Last Reset 00:00:00 Applid BP15PAC1 Jobname BP15PAC1

regexForReportType = “^(?P\w+|END OF DAY STATISTICS|REQUESTED STATISTICS) REPORT(.+)APPLID (?P\S+)\s+JOBNAME \S+$”
comReprtType = re.compile(regexForReportType)

里^匹配要检索的文本的开头,$匹配文本的结束
?P的意思就是命名一个名字为REPORTTYPE的组,以名称为REPORTTYPE为名进行捕获
\w 匹配字母或数字或下划线或汉字
正则表达式[\w]+,\w+,[\w+] 三者有何区别:
[\w]+和\w+没有区别,都是匹配数字和字母下划线的多个字符;
[\w+]表示匹配数字、字母、下划线和加号本身字符;
| 指明两项之间的一个选择。所以就是匹配End of Day Statistics Report或者REQUESTED STATISTICS REPORT,然后捕获到REPORTTYPE组里

“ Collection Date-Time 04/04/2016-00:00:00 Last Reset 00:00:00 ”这一长串用 .+匹配掉
“.”表示任意字符。“+”表示前面表达式一次乃至多次

APPLID (?P\S+)就是把APPLID捕获到APPLID组里,\S表示,非空白就匹配

BP15PAC1 Jobname之间有空格,所以有\s,空白就匹配

使用re.compile()函数,将正则表达式的字符串形式编译为Pattern实例,然后可以使用Pattern实例处理文本

[\s]表示,只要出现空白就匹配
[\S]表示,非空白就匹配

\w 匹配包括下划线的任何单词字符。等价于“[A-Za-z0-9_]"。
\W 匹配任何非单词字符。等价于“[^A-Za-z0-9_]"。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值