Python爬虫百度搜索关键词，结果前6页的结果保存为json格式文件

最新推荐文章于 2023-02-15 12:53:59 发布

Lorigen

最新推荐文章于 2023-02-15 12:53:59 发布

阅读量611

点赞数 1

分类专栏：自学历程文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Lorigen/article/details/113811837

版权

这篇博客记录了作者初次尝试根据他人需求使用Python爬虫抓取百度搜索结果，并将前6页数据保存为JSON格式的过程。文章介绍了从生成URL、处理URL到保存数据的步骤，每个步骤都拆分为独立的函数，便于维护。最后，通过json.dumps转换Python数据为JSON格式并写入文件。

摘要由CSDN通过智能技术生成

初次尝试别人提需求，自己去完成。

自学了Python爬虫都有一段时间了，一直不知道自己学到什么程度。

尝试去让人提需求，试下自己能否解决。

这也是我第一次玩blog，以后完成的坑都会一一发布出来。

入代码正题

我写的时候只是为了完成任务。
写的有些逻辑不够严谨，有问题的或者要修改的，可以提出来，我完善它。

需要的模块

在这里插入图片描述
因为 selenium 的原因，我选择了 xpath 作为我常用的解析库。

代码正文

在这里插入图片描述

在这里插入图片描述

代码思路

第一步生

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。