re正则匹配模块

https://blog.csdn.net/weixin_45912307/article/details/108615866
python re模块:

\A:表示从字符串的开始处匹配
\Z:表示从字符串的结束处匹配,如果存在换行,只匹配到换行前的结束字符串。
\b:匹配一个单词边界,也就是指单词和空格间的位置。例如, 'py\b' 可以匹配"python" 中的 'py',但不能匹配 "openpyxl" 中的 'py'。
\B:匹配非单词边界。 'py\b' 可以匹配"openpyxl" 中的 'py',但不能匹配"python" 中的 'py'。
\d:匹配任意数字,等价于 [0-9]。  digit
\D:匹配任意非数字字符,等价于 [^\d]。not digit
\s:匹配任意空白字符,等价于 [\t\n\r\f]。 space
\S:匹配任意非空白字符,等价于 [^\s]。
\w:匹配任意字母数字及下划线,等价于[a-zA-Z0-9_]。
\W:匹配任意非字母数字及下划线,等价于[^\w]
\\:匹配原义的反斜杠\。


‘.’用于匹配除换行符(\n)之外的所有字符。
‘^’用于匹配字符串的开始,即行首。
‘$’用于匹配字符串的末尾(末尾如果有换行符\n,就匹配\n前面的那个字符),即行尾。

定义正则验证次数:

    ‘*’用于将前面的模式匹配0次或多次(贪婪模式,即尽可能多的匹配) >=0
    ‘+’用于将前面的模式匹配1次或多次(贪婪模式) >=1
    ‘?’用于将前面的模式匹配0次或1次(贪婪模式) 0 ,1
    '{m}'  用于验证将前面的模式匹配m次
    '{m,}'用于验证将前面的模式匹配m次或者多次  >=m
    '{m,n}'   用于验证将前面的模式匹配大于等于m次并且小于等于n次

    ‘*?,+?,??’即上面三种特殊字符的非贪婪模式(尽可能少的匹配)。
    ‘{m,n}’用于将前面的模式匹配m次到n次(贪婪模式),即最小匹配m次,最大匹配n次。
    ‘{m,n}?’即上面‘{m,n}’的非贪婪版本。

	Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字符;
	非贪婪则相反,总是尝试匹配尽可能少的字符。
	在"*","?","+","{m,n}"后面加上?,使贪婪变成非贪婪。

其他字符

‘\\’:'\'是转义字符,在特殊字符前面加上\,特殊字符就失去了其所代表的含义,比如\+就仅仅代表加号+本身。
‘[]’用于标示一组字符,如果^是第一个字符,则标示的是一个补集。比如[0-9]表示所有的数字,[^0-9]表示除了数字外的字符。
‘|’比如A|B用于匹配A或B。
‘(...)’用于匹配括号中的模式,可以在字符串中检索或匹配我们所需要的内容。

常用方法:

re.match(pattern,str) 开头进行匹配,匹配不成功则返回None(从开头匹配一次)
re.search(pattern,str)  # 匹配到的是整个字符串
re.findall(pattern,str)  findall 查找所有
re.sub(pattern,'新的内容',str) 替换
re.split(pattern,str) []   切割
match()   从开头匹配一次
search()	只匹配一次
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 在正则表达式中,我们可以使用元字符来匹配英文字符。其中,使用[a-zA-Z]可以匹配任意英文字母。[a-z]匹配小写字母,[A-Z]匹配大写字母。 如果要匹配多个连续的英文字母,可以使用[a-zA-Z]+。+表示匹配一次或多次前面的表达式。例如,正则表达式"[a-zA-Z]+"可以匹配一个或多个英文字母的字符串。 另外,还可以使用\d来匹配英文单词的首字母。例如,正则表达式"\b\w"可以匹配英文单词的首字母。 如果要匹配英文单词,可以使用正则表达式"\b[a-zA-Z]+\b"。其中,\b表示单词的边界,[a-zA-Z]+表示一个或多个英文字母。这样,我们就可以匹配一个或多个英文单词。 总结起来,正则匹配英文可以使用[a-zA-Z]来匹配单个字母,[a-zA-Z]+来匹配多个连续的英文字母,\b\w来匹配英文单词的首字母,以及\b[a-zA-Z]+\b来匹配英文单词。这些正则表达式可以在查找、替换等操作中用来匹配英文的字符串。 ### 回答2: re正则表达式在匹配英文时,可以使用英文字母的范围[a-zA-Z]来匹配大小写英文字母。具体来说,[a-z]将匹配所有小写字母,[A-Z]将匹配所有大写字母。如果需要同时匹配大小写字母,可以使用[a-zA-Z]。 此外,还可以使用其他元字符和量词来增强匹配的功能。例如,使用\d可以匹配任意数字,\w可以匹配任意字母数字字符,\s可以匹配任意空白字符。可以使用符号+表示匹配一个或多个前一项,符号*表示匹配零个或多个前一项,加号?表示匹配零个或一个前一项。 如果需要匹配特定模式的英文单词,可以使用单词边界符\b。例如,\bword\b将匹配独立的单词"word"。这样可以避免在匹配时将单词的一部分匹配到。 除了基本的正则表达式语法外,还可以使用re模块的一些函数来进行更复杂的正则匹配。例如,re.match(pattern, string)可以从字符串的开头开始匹配模式。re.search(pattern, string)可以在整个字符串中搜索匹配的模式。re.findall(pattern, string)可以找到字符串中所有匹配的模式。 总之,re正则表达式提供了一种强大的工具来匹配英文。无论是简单的字母匹配,还是对复杂模式的匹配,re都能满足需求,并且可以灵活使用其各种功能来处理不同的匹配情况。 ### 回答3: re是Python中的一个模块,可以用来进行正则表达式的匹配操作。在re中,可以使用一些特殊字符和语法来匹配英文。 首先,我们可以使用[a-zA-Z]来匹配英文字母。其中,a-z表示匹配小写字母,A-Z表示匹配大写字母。例如,r'[a-zA-Z]+'可以匹配一个或多个连续的英文字母。 此外,还可以使用\w来匹配包括数字、下划线和字母的字符。例如,r'\w+'可以匹配一个或多个连续的英文字母、数字或下划线。 如果想要匹配整个英文单词,可以使用\b来进行单词边界匹配。例如,r'\b\w+\b'可以匹配一个或多个连续的英文字母、数字或下划线,并且这个单词的边界不会与其他字符连在一起。 另外,如果要匹配英文中的字符或词组,可以使用re中的findall函数。例如,re.findall(r'[a-zA-Z]+', 'Hello World!')将会返回['Hello', 'World'],即匹配到的所有英文单词。 需要注意的是,在使用re进行英文匹配时,还需要考虑大小写敏感的情况。可以使用re.IGNORECASE或re.I参数来忽略大小写进行匹配。 总之,re提供了很多能够匹配英文的方法和语法,可以根据具体的需求选择合适的方法来进行匹配操作。以上是一些常用的方法和技巧,希望对您有所帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值