正则表达式

最新推荐文章于 2024-08-26 06:10:00 发布

LQ_2021

最新推荐文章于 2024-08-26 06:10:00 发布

阅读量96

点赞数

分类专栏：正则表达式文章标签：正则表达式

本文链接：https://blog.csdn.net/LelemamaAnne/article/details/112303359

版权

正则表达式专栏收录该内容

2 篇文章 0 订阅

订阅专栏

"该内容涉及正则表达式在日志报告解析中的应用，重点讲解了^和$的匹配作用，以及?P用于命名捕获组的功能。文中还详细解释了w、[w+]和[S+]的区别，并展示了如何使用re.compile()编译正则表达式实例。内容涵盖正则表达式的匹配规则和在信息技术场景下的具体运用。"

摘要由CSDN通过智能技术生成

End of Day Statistics Report Collection Date-Time 04/04/2016-00:00:00 Last Reset 00:00:00 Applid BP15PAC1 Jobname BP15PAC1

regexForReportType = “^(?P\w+|END OF DAY STATISTICS|REQUESTED STATISTICS) REPORT(.+)APPLID (?P\S+)\s+JOBNAME \S+$”
comReprtType = re.compile(regexForReportType)

里^匹配要检索的文本的开头,$匹配文本的结束
?P的意思就是命名一个名字为REPORTTYPE的组，以名称为REPORTTYPE为名进行捕获
\w 匹配字母或数字或下划线或汉字
正则表达式[\w]+,\w+,[\w+] 三者有何区别：
[\w]+和\w+没有区别，都是匹配数字和字母下划线的多个字符；
[\w+]表示匹配数字、字母、下划线和加号本身字符；
| 指明两项之间的一个选择。所以就是匹配End of Day Statistics Report或者REQUESTED STATISTICS REPORT，然后捕获到REPORTTYPE组里

“ Collection Date-Time 04/04/2016-00:00:00 Last Reset 00:00:00 ”这一长串用 .+匹配掉
“.”表示任意字符。“+”表示前面表达式一次乃至多次

APPLID (?P\S+)就是把APPLID捕获到APPLID组里，\S表示，非空白就匹配

BP15PAC1 Jobname之间有空格，所以有\s，空白就匹配

使用re.compile()函数，将正则表达式的字符串形式编译为Pattern实例，然后可以使用Pattern实例处理文本

[\s]表示，只要出现空白就匹配
[\S]表示，非空白就匹配

\w 匹配包括下划线的任何单词字符。等价于“[A-Za-z0-9_]"。
\W 匹配任何非单词字符。等价于“[^A-Za-z0-9_]"。