Python基础12
正则表达式应用:
- 判断一个字符串是否匹配给定的格式。如:判断用户注册账号是否满足格式
- 从一个字符串中按指定格式提取数据。如:抓取页面中的连接
# re.findall(pattern, string)
import re
s1 = 'testing123'
s2 = 'Testing123'
r = re.findall("test", s1)
print(r) # ['test']
r = re.findall("test", s2)
print(r) # 拿到空字符
一、元字符
1、普通字符
import re
s = 'testing123\nTesting123'
# 1.普通字符:修饰符re.I: 忽略大小写
r = re.findall('test', s, re.I)
print(r) # ['test', 'Test']
2、通配符 .
2. .通配符:匹配除了“\n" 以外的任何单个字符
s = 'testing123\nTesting123'
r = re.findall(".", s)
print(r)
# 3. re.S 可以匹配换行符\n
r = re.findall(".", s, re.S)
print(r)
3、修饰符^
3.^:匹配输入字符串的开始位置,修饰符re.M多行匹配 OR(|)或 多个修饰符
s = 'testing123\nTesting123\ntest'
print(s)
r = re.findall("^test", s)
r1 = re.findall("^test", s, re.M) # 多行匹配
r2 = re.findall("^test", s, re.I | re.M) # 多个修饰符
print(r)
print(r1)
print(r2