正则表达式是一种用来匹配字符串的方法。用一种描述下的语言来给字符串定义一个规则,凡是符合规则的字符串,我们就认为它‘匹配’。
\d–匹配一个数字
\w–匹配一个字母或者数字
. --匹配任何字符
*–表示任意一个字符(包括0个)
?–表示0或1个字符
{n}–表示n个字符
{n,m}–表示n-m个字符
±-表示至少一个字符
\s–可以匹配一个空格(包括tap等空白符)
eg:’\d{3}-\d{3,8}’
[]可以使匹配更加精确
[0-9A-Za-z]可以匹配一个数字或者字母
A|B 可以匹配A或B
^表示行的开头
$表示行的结束
python里面的re模块,包含正则表达式的功能,match()方法判断是否匹配
import re
test = input()
if re.match(r'正则表达式', test):
print('ok')
else:
print('gg')
切分字符串
re.split(‘xxx’,…)
分组
用()提取子串
贪婪匹配
注意正则匹配默认贪婪匹配