我们要爬取的是彼岸壁纸,官网是http://www.netbian.com/,不说了,上代码:
for j in range(100, 120):#想爬取更多修改100 和 120数值
url = "http://www.netbian.com/desk/20" + str(j) + "-1920x1080.htm"
response = requests.get(url)
root = etree.HTML(response.content)
src_list = root.xpath("//div[@id='main']/table[@id='endimg']/tr/td/a/img/@src")
print(src_list)
path = 'E:\\666666'
os.makedirs(path) # 没有666666文件夹代码会创建新的文件夹,如果有666666文件夹请注释掉此行代码
os.chdir(path + '\\')
os.chdir(path)
response = requests.get(src_list[0])
f = open(str(j) + ".jpg", "wb") # random.randint(0, 9)
f.write(response.content)
f.close()
缺点是不能爬取特定分类的壁纸,爬取的都是随机的壁纸,如果想要爬取特定分类的壁纸例如:美女类、创意类、汽车类的壁纸,请下载: