基于Python requests 的入门级福利小分享
前言
下边给刚开始入门学习爬虫的同学分享一下,我做爬虫训练的爬取妹子图片的过程及代码
一、目标网站及介绍
[XIUREN] 2020.04.30 陆萱萱
这个网页由于图片过多,所以加载很慢的 浏览困难
因此才需要通过爬虫来做。
只需要通过开发者模式拿到 以下信息:
1.需要拿图片专辑名称(用于文件夹名)
2图片的张数(用来构造URL)
就可以了
二、截图
1.图片专辑名称
2.URL地址
三 说明分析展示代码
通过网页源码可以很找到url地址,并且很容易的看到规律(从1-图片张数),方便伪造。
代码展示
import requests
import os
str1 = './[XIUREN] 2020.04.30 陆萱萱/' # 在当前目录下
if not os.path.exists(str1): #判断是否存在文件 不存在就创建
os.mkdir(str1)
for y in range(1, 52):
url = 'https://img.f4mm.com/gallery2/20200502/20426/{}.jpg'.format(y) #构造url
img_data = requests.get(url=url).content #获取二进制数据
with open(str1 + str(y) + '.jpg', 'wb') as fp: #保存图片
fp.write(img_data)
print('下载成功', str(y), '-----')`
最后总结
项目十分简单,喜欢的可以拿去试试看。