Python爬虫，爬取500本五星好评书

最新推荐文章于 2023-04-27 16:35:08 发布

Python老王

最新推荐文章于 2023-04-27 16:35:08 发布

阅读量596

点赞数 1

文章标签： Python Python爬虫数据挖掘后端编程语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Pythonlaowan/article/details/100774845

版权

本文介绍了如何使用Python的requests和re库爬取当当网上的前500本五星好评书籍，包括书籍的排名、书名、图片地址、作者、推荐指数、五星评分次数和价格。通过分析网页结构，利用正则表达式提取关键信息，并将数据保存到文件中。

摘要由CSDN通过智能技术生成

来啦，老弟

我们已经知道怎么使用

Requests]

进行各种请求骚操作

也知道了对服务器返回的数据如何使用

正则表达式

来过滤我们想要的内容

那么接下来

我们就使用 requests 和 re 来写一个爬虫

作为一个爱看书的你（说的跟真的似的）

怎么能发现好书呢？

所以我们

爬取当当网的前 **500 **本好五星评书籍

怎么样？

ok

接下来就是

学习 python 的正确姿势

请在电脑的陪同下

边看本文边练习

首先我们要对我们的目标网站进行分析

先摸清对方的底

我们才能战无不胜

如果你依然在编程的世界里迷茫，可以加入我们的Python学习扣qun：784758214，看看前辈们是如何学习的。交流经验。从基础的python脚本到web开发、爬虫、django、数据挖掘等，零基础到项目实战的资料都有整理。送给每一位python的小伙伴！分享一些学习的方法和需要注意的小细节，点击加入我们的 python学习者聚集地

打开这个书籍排行榜的地址

http://bang.dangdang.com/books/fivestars/01.00.00.00.00.00-recent30-0-0-1-1

我们可以看到是这样的一个网页

每一页显示 20 本书

当我们点击下一页的时候

你可以发现地址变了

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫，爬取500本五星好评书

来啦，老弟我们已经知道怎么使用Requests]进行各种请求骚操作也知道了对服务器返回的数据如何使用正则表达式来过滤我们想要的内容那么接下来我们就使用 requests 和 re 来写一个爬虫作为一个爱看书的你（说的跟真的似的）怎么能发现好书呢？所以我们爬取当当网的前 **500 **本好五星评书籍怎么样？ok接下来就是学习 python 的正确姿势请在电脑...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。