Python多线程爬取网站数据，它究竟有多快(1)

最新推荐文章于 2024-07-16 11:18:32 发布

2401_84009130

最新推荐文章于 2024-07-16 11:18:32 发布

阅读量914

点赞数 18

分类专栏：程序员文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_84009130/article/details/137486438

版权

程序员专栏收录该内容

269 篇文章 2 订阅

订阅专栏

本文介绍了一个Python爬虫示例，用于下载一个未加密静态网站上的电脑和手机壁纸，并分享了作者作为技术专家的经历，他提供了一份全面的Python学习资源，覆盖零基础至进阶，包含各种实用内容和持续更新的学习资料。

摘要由CSDN通过智能技术生成

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

PS：如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

python免费学习资料以及群交流解答点击即可加入

基本开发环境

Python 3.6
Pycharm

import requests

import parsel

import threading

相关模块 pip 安装即可

目标网页分析

在这里插入图片描述

这个网站有电脑壁纸也有手机壁纸，还是不错的。

在这里插入图片描述

网站是静态网站，没有加密，可以直接爬取

在这里插入图片描述

在这里插入图片描述

整体思路

1、先在列表页面获取每张壁纸的详情地址

2、在壁纸详情页面获取壁纸真实高清url地址

3、保存壁纸

代码实现

模拟浏览器请求网页，获取网页数据

def get_html(html_url):

‘’’

获取网页源代码

:param html_url: 网页url

:return:

‘’’

response = requests.get(url=html_url, headers=headers)

return response

解析网页数据

def get_par(html_data):

‘’’

把 response.text 转换成 selector 对象解析提取数据

:param html_data: response.text

:return: selector 对象

‘’’

selector = parsel.Selector(html_data)

return selector

保存数据

def download(img_url, title):

‘’’

保存数据

:param img_url: 图片地址

:param title: 图片标题

:return:

‘’’

content = get_html(img_url).content

path = ‘壁纸\’ + title + ‘.jpg’

with open(path, mode=‘wb’) as f:

f.write(content)
自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。

深知大多数Python工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但对于培训机构动则几千的学费，着实压力不小。自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年Python开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上前端开发知识点，真正体系化！

由于文件比较大，这里只是将部分目录大纲截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新

如果你觉得这些内容对你有帮助，可以扫码获取！！！（备注Python）

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上前端开发知识点，真正体系化！

由于文件比较大，这里只是将部分目录大纲截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新

如果你觉得这些内容对你有帮助，可以扫码获取！！！（备注Python）

关注

18
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。