爬取图片
1.获取网页代码
2.用正则表达式提取图片链接
3.然后爬取图片将其保存在文件夹中
import requests
import re
import os
requests.packages.urllib3.disable_warnings()
kv={"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36"}
r=requests.get("https://www.vmgirls.com/13506.html",headers=kv)
r.raise_for_status()
r.encoding=r.apparent_encoding
haha=re.findall('<a href="(.*?)" alt=".*?" title=".*?">',r.text)
dir_name=re.findall('<h1 class="post-title h3">(.*?)</h1>',r.text)[-1]
if not os.path.exists(dir_name):
os.mkdir(dir_name)
for url in haha:
file_name=url.split("/")[-1]
meizi=requests.get(url,headers=kv)
with open(dir_name+'/'+file_name,'wb') as f:
f.write(meizi.content)
以下为爬取出的图片展示
有问题欢迎大家留言,我会快速答复,进行修改