- 1.模式语言
1)任何字符只与其本身匹配
2)"."匹配任意字符
3)"*" 表示其前面那个字符可匹配0个或任意多个相同字符
4)"^"只匹配目标串的开头
5)"$"只匹配目标串的结尾
- 2.原始字符串
定义:在常规字符串前加上r或者R前缀.
r'd:\test\1.txt'
如不用原始字符串则:
'd:\\test\\1.txt'
特点:字符串中的反斜杠'\'不能作为转义,在相应字符串中做原样保留,但是单/双引号前的\仍作为转义字符
- 3.元字符
正则表达式包re规定了14个元字符
. ^ $ * + ? | \ { } [ ] ( )
- 4.主要操作
1)生成正则表达式对象
re.compile(pattern,flag=0)
r1=re.compile('abc')
这个语句就是生成与'abc'对应的正则表达式对象,并将其值赋给r1变量
2)检索
re.search(pattern,string,flag=0)
3)匹配
re.match(pattern,string,flag=0)
4)分割
re.split(pattherm,string)
5)查找匹配的字符串
re.findall(pattern,string)