Python3 爬虫
正则表达式
- match()
- search()
- findall()
- sub()
match()
从字符串的开头开始匹配,一旦开头不匹配,则整个匹配就失败了。
主要作用:检测正则表达式是否匹配字符串的作用函数。
(需要考虑开头内容,做匹配时不方便,适合检测规则。)
定义变量content
=‘字符’
打印出内容。
import re
content = 'Hello 1234567 World_This is a Regex Demo'
print(len(content))
result = re.match('^Hello\s\d\d\d\s\d{4}\s\w{10}',content)
print(result)
print(result.group())
print(result.span())
Note:
- 正则表达式
^Hello\s\d\d\d\s\d{4}\s\w{10}
^
是匹配字符串的开头,以Hello
开头;
\s
匹配空白字符,匹配目标字符串的空格;
\d
匹配数字