记录一次初学者使用 python 爬取大众点评的过程

本文记录了一名Java程序员初涉Python爬虫,爬取大众点评商户信息的经历。通过分析静态页获取城市信息,利用selenium爬取商户地址,但在翻页和反爬机制中遇到挑战,包括登录验证、滑动验证等问题。最终找到临时解决方案,但完整的自动化验证功能仍在开发中。
摘要由CSDN通过智能技术生成

记录一次初学者使用 python 爬取大众点评的过程

前言

笔者是一个写 java 的苦逼程序猿,因为室友妹子的工作需求,帮她爬取大众点评的商户信息,顺便也试试使用 python 爬虫和使用 java 爬虫有什么不同。

爬取过程

爬取城市信息

这一步最简单, 因为大众点评的城市信息写在静态页上的, 只需要进入大众点评的官网上, 点击左上角的城市,就可以看到这个页面:
大众点评城市列表
打开网页调试器就可以看到每个城市的 url 地址, 爬取下来即可, 最后获得每个城市的 url 地址,为接下来爬取商户信息做准备
在这里插入图片描述

爬取商户地址

这里我只爬取学习培训下的商户信息, 所以直接城市的 url 地址加上 /ch75/p1 就可以直接进入到商户的列表,以成都为例 http://www.dianping.com/chengdu/ch75/p1 可以直接进入到成都的学习培训的商户列表,打开网页调试器, 爬取到每页的商户的 url 地址信息即可,得到每个商户的 url 地址
在这里插入图片描述
第二

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值