python正则表达式

最新推荐文章于 2023-11-30 20:00:00 发布

半个轮子工

最新推荐文章于 2023-11-30 20:00:00 发布

阅读量116

点赞数

本文链接：https://blog.csdn.net/g894442165/article/details/111178323

版权

关键词由CSDN通过智能技术生成

Python 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

以前不想学的总得还啊，今天遇到了从一堆数据里截取自己想要的字符，用了普通的函数截取，发现这个规律有漏洞，故只好——正则表达式，下面开始苦逼学习。

Python将正则表达式功能整合在re模块中。

re.match函数

语法：re.match(pattern, string, flags=0)

pattern	匹配的正则表达式
string	要匹配的字符串。
flags	标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。

flags可选的标志位如下：

修饰符	描述
re.I	使匹配对大小写不敏感
re.L	做本地化识别（locale-aware）匹配
re.M	多行匹配，影响 ^ 和 $
re.S	使 . 匹配包括换行在内的所有字符
re.U	根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X	该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。

从字符串的起始位置匹配一个模式，如果匹配成功则返回匹配对象，否则返回None.

import re
print(re.match('www', 'www.runoob.com').span())  # 在起始位置匹配
print(re.match('com', 'www.runoob.com'))         # 不在起始位置匹配

结果：
(0, 3)
None

import re
 
line = "Cats are smarter than dogs"
 
matchObj = re.match( r'(.*) are (.*?) .*', line, re.M|re.I)
 
if matchObj:
   print "matchObj.group() : ", matchObj.group()
   print "matchObj.group(1) : ", matchObj.group(1)
   print "matchObj.group(2) : ", matchObj.group(2)
else:
   print "No match!!"
结果：
matchObj.group() :  Cats are smarter than dogs
matchObj.group(1) :  Cats
matchObj.group(2) :  smarter