爬虫学习第六天
re的使用:
一篇关于re语法使用说明
在学习的时候没有什么问题,刚开始不懂什么意思,后来看了好几遍才理解到表达式的意思。
学习代码如下:
import re
str1 = "I love China52.0 love!"
m1 = re.match(r'.',str1)
m2 = re.match(r'\w',str1)
m3 = re.match(r'\D',str1)
m4 = re.match(r'I',str1)
m5 = re.match(r"\S",str1)
print(m5.group())
#match 是从左开始匹配
s1 = re.search(r'love',str1)
s2 = re.search(r'l\w',str1)
s3 = re.search(r'C\w+.\d',str1)
print(s3.group())
#寻找所有的l
f1 = re.findall(r'l',str1)
print(f1)
#匹配需要的字符串
str2 = "<div><a herf=www.baidu.com>baidu百度</a></div>"
t1 = re.findall(r"herf=(.+)>b",str2)
print(t1)
#替换思路:首先匹配到了再替换再加字符串
su1 = re.sub(r'<div>(.+)</div>',r'<span>\1</span>',str2)
print(su1)