正则表达式是什么:
“正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。”
最后一句话很重要,正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。
正则表达式如何用:
检索功能
直接举一个例子吧:给你任意的字符串,用python编写一个程序找出这段字符串是否有两个连续的字母。如果用普通方法的话:
def fd(text):
''' 判断给定的字符串是否
包含两个连续的字母'''
num=len(text)
for i in range(len(text)-1):
if text[i].isalpha():
if text[i+1].isalpha():
return True;
return False
首先编写一个fd()
函数用来完成任务,接下来随便给函数传值
print(fd('12ky138'))
结果是
True
如果要是找连续88
个字母的呢?我们会发现这样做很麻烦。
所以,我们引入了正则表达式
,上面这个问题用上正则表达式怎么解?解法如下:
>>> import re
>>> i=re.compile(r'[a-zA-Z]{2,}')
>>> m=i.search('12ky138').group()
>>> print(m)
ky
这样就轻松解决了。那我们来看看这段代码,首先调用re
模块,然后向re.compile()
中传入一个字符串,表示正则表达式,然后在search()
方法中传入要查找的字符串(如果search()
方法找不到匹配的字符串时,将返回None
),紧接着调用方法group()
返回匹配的结果。
让我们再来看看正则表达式r'[a-zA-Z]{2,}'
,首先r
表示该段字符串是原始字符串,那也就没有转义序列的存在了
,[a-zA-Z]
的意思代表任意一个大写或小写字母
,{2,}
的意思是前面的分组至少出现两次
,所以正则表达式[a-zA-Z]{2,}
可以匹配连续两个字母以上的字符串。
正则表达式有特殊意义的字符:
正则表达式有特殊意义的字符不算多,举两个例子:
*
代表匹配前面分组0次或多次+
代表匹配前面分组至少一次
*上面只是其中的一部分,网上有很多关于正则表达式符号的表格介绍*
替换功能
来看一段代码:
>>> import re
>>> i=re.compile(r'Tom')
>>> i.sub('Jerry','I love Tom')
'I love Jerry'
上面有一个新的方法sub()
,他的第一个参数用来取代被正则表达式匹配的字符串
,第二个参数是正则表达式要匹配的字符串
。sub()
方法返回替代后的字符串
。
以上就是正则表达式的基本用法了,还有更多玩法还需要你们探索。