(python爬虫项目)某婚恋网的简单数据爬取

最新推荐文章于 2024-10-05 11:45:28 发布

AkingBnitSS

最新推荐文章于 2024-10-05 11:45:28 发布

阅读量5.8k

点赞数 3

分类专栏：爬虫项目

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40389140/article/details/79310373

版权

这篇博客介绍了如何使用Python爬虫从7rdao.com网站上抓取指定省份用户的个人信息。通过分析URL参数，作者展示了如何修改URL以获取不同省份和城市的用户数据，并揭示了用户详情页面URL的规律。接着，博主计划利用正则表达式提取所需信息，并给出了部分代码框架，但由于编辑器问题，未完成全部代码，表示将在其他平台更新完整版博客。

摘要由CSDN通过智能技术生成

爬取项目目标网站:
www.7rdao.com

想要获得的数据:
获取想要省份用户基本信息。
(你想要哪个省就爬哪个省份咯)

既然目标明确,工具齐备.
话不多说,直接打开网页分析.

网页分析:
这里写图片描述
这是我们想获取的信息.先提交一次看有什么反应!

这里写图片描述完整的URL:
http://www.7rdao.com/user/search.aspx?sex=0&ddl_StartAge=23&ddl_EndAge=28&ddl_Province=%E5%9B%9B%E5%B7%9D&ddl_City=%E6%88%90%E9%83%BD&ddl_Area=%E5%8C%BA%E3%80%81%E5%8E%BF
是这样的一个字符出形式，从参数的命名可以看出来相关需要提交的参数和受控制所对应的元素。
sex=性别,0是女,1是男
ddl_StartAge=开始年龄
ddl_EndAge=结束年龄
ddl_Province=省份
ddl_City=城市
ddl_Area=县和区
这就是第一次操作得到的结果,我们试试能不能少提交某个参数,可不可以得到一些反馈,我就先把

最低0.47元/天解锁文章

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。