java写入文件没有文件夹自动创建_爬取WIN4000高清壁纸,自动创建文件夹分类保存...

8a1b729177502ffd2c8598ec4a07244d.png

话不多少,由于工作比较忙,以下直接源码分享,感兴趣的朋友可以留言交流

此原创源码,只限于测试学习使用。

"""导入相关模块"""import requestsfrom bs4 import BeautifulSoupimport timeimport os"""确定一级网页URL"""
url_1 = 'http://www.win4000.com/wallpaper_205_0_0_1.html'
user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36'
headers = {'User-Agent': user_agent}
res_1 = requests.get(url_1, headers=headers)if res_1.status_code == requests.codes.ok:
print("---网页请求成功,开始网页分析---")
soup_1 = BeautifulSoup(res_1.text, 'lxml')
time.sleep(0.4)if soup_1 != None:
print("---网页分析成功,开始数据提取---")
time.sleep(0.4)
style_contents = soup_1.find('div', class_="list_cont Left_list_cont Left_list_cont")
url_2 = style_contents.find('a')['href']"""循环传递二级网页URL"""
flag = 1
name = ''
sum = 0while flag:
res_2 = requests.get(url_2, headers=headers)
soup_2 = BeautifulSoup(res_2.text, 'lxml')
picture_info = soup_2.find('img', class_="pic-large")
picture_url = picture_info['src']
picture_type_name = picture_info['title']
picture = requests.get(picture_url, headers=headers) if name != picture_type_name:
i = 1
os.makedirs(f'C:/Users/三悟小道/Pictures/WIN4000桌面壁纸/大陆明星壁纸/{picture_type_name}')
print(f"文件夹--{picture_type_name}创建完毕") with open(f'C:/Users/三悟小道/Pictures/WIN4000桌面壁纸/大陆明星壁纸/{picture_type_name}/'+picture_type_name+str(i)+'.jpg', 'wb') as ps:
ps.write(picture.content)
ps.close()
sum += 1
time.sleep(0.45)
name = picture_type_name
picture_next = soup_2.find('div', class_="pic-next-img")
picture_next_url = picture_next.find('a')['href']
print(f"{picture_type_name}{i}.jpg下载完毕")
url_2 = picture_next_url
flag += 1
i += 1
print(f"---总共下载了{sum}张图片---")

以下为运行效果:

8d80b7cd00650c6e3cdb9f3276aff90f.png

41f3f04349362473b8aa147193133b04.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值