Springboot与Selenium合体变蜘蛛爬企查查

最新推荐文章于 2024-08-15 18:56:08 发布

爆米花机枪手

最新推荐文章于 2024-08-15 18:56:08 发布

阅读量4.1k

点赞数 1

分类专栏：爬虫文章标签：企查查爬虫 Selenium 爬虫分析打码平台

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qqhjqs/article/details/79018712

版权

本文介绍了如何使用Selenium配合Java处理企查查的滑块验证、图片验证码和数字验证码，成功登录后抓取企业详情、人物图谱和投资图谱等数据。通过打码平台解决验证码难题，并分享了登录验证和数据抓取的思路。

摘要由CSDN通过智能技术生成

　　最近工作上需要一些企业的详细的数据，工商信息啦，基本信息啦，还有一些关系图(投资关系、人物图谱)之类的，然后我来负责从企查查上弄些数据。

强调：下面只是快速实现数据抓取的思路，没有详细的代码，同时也拒绝伸手党。

　　现实中，一些工商信息网站会被无数的爬虫“骚扰”，所以网站的反爬虫策略也是越来越高，就拿企查查来说，基本的信息是直接可访问的，但是像人物图谱和企业图谱这些内容还是需要登录的，
特别是人物图谱，非VIP会员，一天也只能看两次

企查查的登录也是做了很多限制
比如图片验证码啊，数字验证码啊，还有验证码异常出现刷新按钮啊等等(之前在做的过程中发现的没有及时截图)

但是有了selenium这些都不是问题~接下来按照如下思维导图做一个抓取的分析(代码想了许久还是不贴出来了)

登录

滑块验证

首先出场的是滑块验证，这个可以使用Selenium中的Actions.clickAndHold()来破防，打开浏览器Element面板，边滑动滑块边观察Html

最低0.47元/天解锁文章

爆米花机枪手

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
6
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。