End of Day Statistics Report Collection Date-Time 04/04/2016-00:00:00 Last Reset 00:00:00 Applid BP15PAC1 Jobname BP15PAC1
regexForReportType = “^(?P\w+|END OF DAY STATISTICS|REQUESTED STATISTICS) REPORT(.+)APPLID (?P\S+)\s+JOBNAME \S+$”
comReprtType = re.compile(regexForReportType)
里^匹配要检索的文本的开头,$匹配文本的结束
?P的意思就是命名一个名字为REPORTTYPE的组,以名称为REPORTTYPE为名进行捕获
\w 匹配字母或数字或下划线或汉字
正则表达式[\w]+,\w+,[\w+] 三者有何区别:
[\w]+和\w+没有区别,都是匹配数字和字母下划线的多个字符;
[\w+]表示匹配数字、字母、下划线和加号本身字符;
| 指明两项之间的一个选择。所以就是匹配End of Day Statistics Report或者REQUESTED STATISTICS REPORT,然后捕获到REPORTTYPE组里
“ Collection Date-Time 04/04/2016-00:00:00 Last Reset 00:00:00 ”这一长串用 .+匹配掉
“.”表示任意字符。“+”表示前面表达式一次乃至多次
APPLID (?P\S+)就是把APPLID捕获到APPLID组里,\S表示,非空白就匹配
BP15PAC1 Jobname之间有空格,所以有\s,空白就匹配
使用re.compile()函数,将正则表达式的字符串形式编译为Pattern实例,然后可以使用Pattern实例处理文本
[\s]表示,只要出现空白就匹配
[\S]表示,非空白就匹配
\w 匹配包括下划线的任何单词字符。等价于“[A-Za-z0-9_]"。
\W 匹配任何非单词字符。等价于“[^A-Za-z0-9_]"。