python爬虫（期末项目：爬取壁纸）

最新推荐文章于 2023-06-28 08:33:57 发布

Xia_JF

最新推荐文章于 2023-06-28 08:33:57 发布

阅读量1.5k

点赞数

文章标签： python 爬虫开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Xia_JF/article/details/121958808

版权

本文介绍了如何使用Python发起HTTP请求，获取并解析网页内容，特别是针对爬取壁纸站点进行了解析和数据保存。通过第三方库如Beautifulsoup解析HTML，用json模块处理JSON数据，并将二进制数据（如图片）保存到本地。为了提高效率，文章提到直接爬取整套壁纸而非逐张下载。

摘要由CSDN通过智能技术生成

1、发起请求
使用http库向目标站点发起请求，即发送一个Request
Request包含：请求头、请求体等
Request模块缺陷：不能执行JS 和CSS 代码

2、获取响应内容
如果服务器能正常响应，则会得到一个Response
Response包含：html，json，图片，视频等

3、解析内容
解析html数据：正则表达式（RE模块），第三方解析库如Beautifulsoup，pyquery等
解析json数据：json模块
解析二进制数据:以wb的方式写入文件

4、保存数据
数据库（MySQL，Mongdb、Redis）
文件

一张一张地找壁纸效率太低，所以直接利用爬虫下载整套。

http://sj.zol.com.cn/bizhi/

（1）

（2）

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Xia_JF CSDN认证博客专家 CSDN认证企业博客

码龄5年

1: 原创

149万+: 周排名

130万+: 总排名

1534: 访问

: 等级

10: 积分

0: 粉丝

0: 获赞

0: 评论

1: 收藏

私信

关注

热门文章

python爬虫（期末项目：爬取壁纸） 1535

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。