【python】re模块常用方法

基础知识点

通配符含义示例匹配结果
reg1 | reg2匹配表达式reg1或者表达式reg2foo | barbar
.匹配除\n以外的任意字符ab.babdb
^匹配字符串起始部分
$匹配字符串终止部分
*匹配0次或多次前面出现的正则表达式
+匹配一次或多次前面出现的正则表达式
?匹配0次或1次前面出现的正则表达式
{m,n}匹配m~n次前面出现的正则表达式
[abc]匹配中括号内任意一个字符,结果可能是a或b或c
[x-y]匹配x~y范围中的任意单个字符
[^x-y]不匹配x~y范围中的任意单个字符
(*|+|?|{})?匹配上面频繁出现符号的非贪婪版(*|+|?|{})?({})
\d匹配任何十进制数字
\w匹配任何字母数字字符,相当于类[a-zA-Z0-9_]
\s匹配任何空格字符,它相当于类[\t\n\r\f\v]
\b匹配任何单词边界
\1.反斜杠后边跟元字符去除特殊功能;(即将特殊字符转义成普通字符),2.反斜杠后边跟普通字符实现特殊功能;(即预定义字符),3.\2引用序号对应的字组

正则匹配模式表

标志含义
re.I(IGNORECASE)使匹配对大小写不敏感
re.S(DOTALL)使.匹配包括换行在内的所有字符
re.L(LOCALE)做本地化识别(locale-aware)匹配,法语等
re.M(MULTILINE)多行匹配,影响^和$
re.X(VERBOSE)该标志通过给予更灵活的格式以便将正则表达式写得更易于理解
re.U根据Unicode字符集解析字符,这个标志影响\w,\W,\b,\B

re模块常用方法

  1. re.search(pattern, string, flags)
    使用可选标记搜索字符串中第一次出现的正则表达式模式。如果匹配成功,则返回匹配对象,否则返回None
import re
#与re.match()的区别:match从字符串起始位置开始匹配,此例中match将返回None
m = re.search('foo','asdasdfooasd')
if m is not None:
	print(m.group())
  1. re.match(pattern, string, flags),从字符串起始位置开始匹配,若匹配失败,则返回None
import re
m = re.match('(foo\w)(\w)', "fooabwder")
print(m.group(0)) #fooab
print(m.group(1)) #fooa
print(m.group(2))#b
print(m.groups())#("fooa", "b")
  1. re.findall(pattern, string, flags)找出所有匹配的项,并以列表形式返回
    re.finditer(pattern, string, flags)功能与上面findall一样,不过返回的时迭代器。
import re
m = re.findall("foo\w", "foosdfooefefeffoo2")
print(m)#['foos', 'fooe', 'foo2']
  1. re.split(pattern, string, max=0)
    根据pattern将string分割成列表,并返回列表,分割操作max次
  2. re.sub(pattern, newcontent, string,num,flags=0)
    将匹配的内容替换成newcontent,替换num次
import re
str = "2005-2018 douban.com, all rights reserved 北京豆网科技有限公司"
#将第一个年份2005替换成“hi”
m = re.sub("\d{4}",'hi', str, 1)
print(m) #"hi-2018 douban.com, all rights reserved 北京豆网科技有限公司"
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值