以上是咱们今天要爬取的图片,可以看到这个游戏壁纸主题有35页,咱们不是要爬取这35 页的图片。这个页面的尺寸也不是高清原图。我们发现点进去后能看到高清图,如下:
这个就是咱们想要的内容了,这个页面主图是只有一张,蒙多这个主题是有10张的,我们可以在主图上点击下一页,跳转到下一张。这里很适合我们使用selenium去爬取了。
直接来分享我的爬取思路吧,代码如下:
from selenium import webdriver
from lxml import etree
import time
import os
import requests
path='e:/desketop/picture/'
driver = webdriver.Chrome()
driver.implicitly_wait(20)
def save(url):
driver.get(url)
title=driver.find_element_by_css_selector('.arc_main_pic_img').get_attribute('title')
src=driver.find_element_by_css_selector('.arc_main_pic_img').get_attribute('src')
# print(src)
r