正则表达式
[网上的正则表达式说明]
一个简单的Python案例
这个案例爬去网页,通过正则表达式把网页中的ip地址提取出来,p = r’(?????:[0,1]?\d?\d|2[0-4]\d|25[0-5]).){3}(?:[0,1]?\d?\d|2[0-4]\d|25[0-5]))’,这句是核心正则表达式,可以从上面两个网站了解其含义。
import requests
import re
headers3 = {
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.87 Safari/537.36'
}
r = requests.get("http://ip.yqie.com/ipproxy.htm",headers = headers3)
html = r.content.decode('utf8')
p = r'(?:(?:(?:[0,1]?\d?\d|2[0-4]\d|25[0-5])\.){3}(?:[0,1]?\d?\d|2[0-4]\d|25[0-5]))'
ip = re.findall(p,html)
print(ip)