Python爬取优美图库的图片并下载到img文件夹中
# coding:utf-8
# 1.拿到主页面的源代码,然后提取到子页面的链接地址 href
# 2.通过href拿到子页面内容,从子页面中找到图片的下载地址 img->src
# 3.下载图片
import requests
from bs4 import BeautifulSoup
import time
url = "https://www.umei.cc/bizhitupian/weimeibizhi/"
resp = requests.get(url)
resp.encoding='utf-8'#处理乱码
# print(resp.text)
#把源代码交给BeautifulSoup
main_page=BeautifulSoup(resp.text,"html.parser")
alist=main_page.find("div",class_="TypeList").find_all("a")#拿范围,第一次缩小
# print(alist)
for a in alist:
href=a.get("href")
#拿到子页面的源代码
child_page_resp=requests.get(href)
child_page_resp.encoding="utf-8"
child_page_resp_text=child_page_resp.text
#从子页面中拿到图片的下载链接
child_page=BeautifulSoup(child_page_resp_text,"html.parser")
p=child_page.find("p",align="center")
img=p.find("img")
src=img.get("src")
#下载图片
img_resp=requests.get(src)
# img_resp.content#这里拿到的字节
img_name=src.split("/")[-1] #拿到url中的最后一个/以后的内容
with open("img/" + img_name,mode="wb") as f:
f.write(img_resp.content) #图片内容写入到文件
print("over!",img_name)
time.sleep(1)
print("all_over!")