2021-01-05

最新推荐文章于 2024-07-12 16:16:27 发布

weixin_42464885

最新推荐文章于 2024-07-12 16:16:27 发布

阅读量2.3k

点赞数

文章标签： python 爬虫 request

本文链接：https://blog.csdn.net/weixin_42464885/article/details/112250585

版权

基于Python requests 的入门级福利小分享

前言

下边给刚开始入门学习爬虫的同学分享一下，我做爬虫训练的爬取妹子图片的过程及代码

一、目标网站及介绍

[XIUREN] 2020.04.30 陆萱萱
这个网页由于图片过多，所以加载很慢的浏览困难
因此才需要通过爬虫来做。
只需要通过开发者模式拿到以下信息：
1.需要拿图片专辑名称（用于文件夹名）
2图片的张数（用来构造URL）
就可以了

二、截图

1.图片专辑名称
在这里插入图片描述

2.URL地址

在这里插入图片描述

三说明分析展示代码

通过网页源码可以很找到url地址，并且很容易的看到规律（从1-图片张数），方便伪造。

代码展示

import requests
import os


str1 = './[XIUREN] 2020.04.30 陆萱萱/'      # 在当前目录下

if not os.path.exists(str1):    #判断是否存在文件 不存在就创建
    os.mkdir(str1)


for y in range(1, 52):

    url = 'https://img.f4mm.com/gallery2/20200502/20426/{}.jpg'.format(y)  #构造url
    img_data = requests.get(url=url).content   #获取二进制数据

    with open(str1 + str(y) + '.jpg', 'wb') as fp:   #保存图片
        fp.write(img_data)
        print('下载成功', str(y), '-----')`

最后总结

项目十分简单，喜欢的可以拿去试试看。

weixin_42464885

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
2021-01-05

基于Python requests 的入门级福利小分享前言下边给刚开始入门学习爬虫的同学分享一下，我做爬虫训练的爬取妹子图片的过程及代码一、目标网站及介绍[XIUREN] 2020.04.30 陆萱萱这个网页由于图片过多，所以加载很慢的浏览困难因此才需要通过爬虫来做。只需要通过开发者模式拿到以下信息：1.需要拿图片专辑名称（用于文件夹名）2图片的张数（用来构造URL）就可以了二、截图1.图片专辑名称2.URL地址三说明分析展示代码通过网页源码可以很找到url地址，并
复制链接

扫一扫