正则表达式【持续总结】

最新推荐文章于 2024-05-15 11:44:48 发布

duhaomin

最新推荐文章于 2024-05-15 11:44:48 发布

阅读量786

点赞数

分类专栏： Python 文章标签： python 正则表达式

本文链接：https://blog.csdn.net/lileiyang12/article/details/41819475

版权

Python 专栏收录该内容

26 篇文章 0 订阅

订阅专栏

1：

需要匹配的是这样的字符串：

2007-08-29 21:46:20 ..... 424 $PLUGINSDIR\ioSpecial.ini
2014-11-21 10:19:42 ..... 142736 $PLUGINSDIR\modern-wizard.bmp
2014-11-21 10:19:48 ..... 213711 $_8_\Default.cupf

中间的数值是大小，期望得到的是什么文件，多大

python脚本：

if __name__ == "__main__":
	eachSizePattern = re.compile(ur'\d{4}-\d{2}-\d{2}\s+\d{2}:\d{2}:\d{2}\s+.*\s+(\d+)\s+.*\\(.*\.\w+)')
	testString = '2007-08-29 21:46:20 .....          424               $PLUGINSDIR\ioSpecial.ini'
	match = eachSizePattern.search(testString)
	fileName = '%s' %(match.group(2))
	fileSize = int(match.group(1))
	print fileName + ' , '+str(fileSize)

分析：

001：re.compile(ur

这里边的u表示unicode，r表示不用再加转义字符了

002：\d{4}-\d{2}-\d{2}很简单，匹配那个日期

003：\s+匹配不包含空白符的字符串，\d{2}:\d{2}:\d{2}\s+就不多说了

004：.* 匹配任意数量的不包含换行的字符，此时用来过滤那么多的点；\s+匹配之后的空格

005：(\d+)匹配多个数字，这样可以得到那个数字；\s+匹配之后的空格

006：.*\\ 匹配路径

007：(.*\.\w+) 匹配：任意字符串或者点或者 (>=1个的字母或数字或下划线或汉字)

为什么我们要的文件名字是group(2)？数字是group(1)呢？

因为：

整个正则表达式匹配到的会复制给group()或者说是group(0)