他失恋了，他很快乐——因为我给了一个网站

最新推荐文章于 2024-05-30 11:43:13 发布

小熊猫爱恰饭

最新推荐文章于 2024-05-30 11:43:13 发布

阅读量200

点赞数

分类专栏： python基础文章标签： python

本文链接：https://blog.csdn.net/m0_67575344/article/details/124068658

版权

python基础专栏收录该内容

370 篇文章 116 订阅

订阅专栏

一些过场剧情:

死党一直暗恋校花，但是校花对他印象也不差，就是死党一直太怂了，不敢去找校花，直到昨天看到校花登上了校董儿子的豪车，死党终于彻底死心，大醉一场，作为他的兄弟，我怎么能看他郁郁不振呢？

为了让他忘掉校花，走出阴影，我于是决定把我新收藏的网站分享给他，顺便分享给大家，纯纯的交流技术，大家备好纸巾，不对，备好纸笔😂
请添加图片描述
爬取目标

网址：（实在是不敢放，满满的求生欲，官方大佬手下留情）
兄弟们啊，不要怪我，放图不行啊，我是来交流技术的。
要用的工具

软件：

python 3.8
pycharm 2021专业版

模块：

requests
parsel

没有模块 pip 安装模块即可

流程解析

我们首先就是先进入到这个网址，向网站发送网络请求。

然后去拿到它的网页源代码数据，右键点击，查看他的网页源代码。

我们访问网站拿到的数据就是它。
请添加图片描述
实现代码

import requests
import parsel
import re
import os

for page in range(1, 11):
    print(f'==================正在爬取第{page}页==================')
    # 1.向目标网站发送请求（get，post）
    response = requests.get(f'https://www.网站不提供，想用来实践技术的话可以私我拿.com/page/{page}')
    # 2. 获取数据（网页源代码）
    data_html = response.text
    # 3. 解析网页（re正则表达式，css选择器，xpath，bs4，json） 提取每一个详情页的链接与标题
    zip_data = re.findall('<a href="(.*?)" target="_blank"rel="bookmark">(.*?)</a>', data_html)
    for url, title in zip_data:
        print(f'----------------正在爬取{title}----------------')
        if not os.path.exists('img/' + title):
            os.mkdir('img/' + title)
        # 4. 向详情页发送请求
        resp = requests.get(url)
        # 5. 获取数据（网页源代码）
        url_data = resp.text
        # 6. 解析网页 （提取图片链接）
        selector = parsel.Selector(url_data)
        img_list = selector.css('p>img::attr(src)').getall()

        for img in img_list:
            # 7. 向图片链接发送请求
            # 8. 获取数据（图片二进制数据）
            img_data = requests.get(img).content
            # 9. 保存数据
            img_name = img.split('/')[-1]
            with open(f"img/{title}/{img_name}", mode='wb') as f:
                f.write(img_data)
            print(img_name, '爬取成功！！！')
        print(title,'爬取成功！！！')

暗恋单恋都不可靠，还是要胆大脸皮厚，主动一点到手了才有结果，不然女朋友都是别人的了，祝大家有情人终成眷属，没有的2022年那必有！
请添加图片描述

欢迎大家一起在评论中讨论技术，编程嘛，不能一味死板，要灵活有趣才有动力，不低俗不违法，一起进步！

小熊猫爱恰饭

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
他失恋了，他很快乐——因为我给了一个网站

一些过场剧情:死党一直暗恋校花，但是校花对他印象也不差，就是死党一直太怂了，不敢去找校花，直到昨天看到校花登上了校董儿子的豪车，死党终于彻底死心，大醉一场，作为他的兄弟，我怎么能看他郁郁不振呢？为了让他忘掉校花，走出阴影，我于是决定把我新收藏的网站分享给他，顺便分享给大家，纯纯的交流技术，大家备好纸巾，不对，备好纸笔😂爬取目标网址：（实在是不敢放，满满的求生欲，官方大佬手下留情）兄弟们啊，不要怪我，放图不行啊，我是来交流技术的。要用的工具软件：python 3.8pycharm 202
复制链接

扫一扫