爬虫入门，带你用30行代码爬取高清美女写真，附安装包+源码

最新推荐文章于 2025-03-06 01:09:36 发布

流浪哥--互联网的浪潮儿

最新推荐文章于 2025-03-06 01:09:36 发布

阅读量5.4k

点赞数 4

分类专栏：爬虫文章标签： python 爬虫 pip

本文链接：https://blog.csdn.net/junior5/article/details/119564423

版权

爬虫专栏收录该内容

7 篇文章

订阅专栏

1、准备工作

1 高清壁纸：https://www.36992.com/girls/list-1.html

2 Python环境

Python3.9新特性：
字典“并集”运算符
类型提示的改善
装饰器语法更加灵活
classmethod 支持包装其他描述器
新增模块、函数、方法
Python官网下载：https://www.python.org/

3 PyCharm编译器

优点：
1 )每个文件都有其输出窗口
2 )可以终止进程（只要点下按钮就行）
3 )各种提示超强：
①没用的变量颜色会变灰
②用错了的变量下面会有红色波浪线
③书写提示
4 )索引功能超强，
PyCharm官网下载：https://www.jetbrains.com/pycharm/download/#section=windows

4 requests，lxml库安装

Requests:

打开cmd命令管理器，输入pip install requests,显示如下图则安装成功。
在这里插入图片描述

lxml:

打开cmd命令管理器，输入pip install lxml,显示如下图则安装成功。
在这里插入图片描述

2 、代码和效果展示

1 >代码


import requests
from lxml import etree

'''
Python 交流群：
838 123 629
'''

def down_image( page ):
    print(f'页面{page}，开始')
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36'
    }
    url = f'https://www.36992.com/girls/list-{page}.html'
    resp = requests.get(url,headers=headers)
    resp.encoding = 'gbk'
    with open('index.html', 'wb') as f:
        f.write(resp.content)
    tree = etree.HTML(resp.content)

    # 页面标签，XPath的高级用法，相对路径
    node_list = tree.xpath('//li//img')
    print(len(node_list))

    sub_url_list = []
    for node in node_list:
        srcPath=node.xpath('./@src')[0]
        # 获取网页路径，加if是规范写法
        if len(srcPath) > 0:
            img_url =str(srcPath).replace("pic_360","pic")
            title = node.xpath('./@alt')[0]
            sub_url_list.append((img_url, title))

    # 开始保存图片
    for sub_url, title in sub_url_list:
        suffix = sub_url.split('.')[-1]
        img_content = requests.get(sub_url).content
        with open(f'123/{title}.{suffix}', 'wb') as f:
            f.write(img_content)
            f.close()
    print(f'页面{page}，完成')

if __name__ == '__main__':
    for page in range(1,60):
        down_image(page)

2 >效果

在这里插入图片描述

3 、知识点

1 >路径解析

第一页：https://www.36992.com/girls/list-1.html
在这里插入图片描述
第二页：https://www.36992.com/girls/list-2.html

规律：url = f’https://www.36992.com/girls/list-{page}.html’