[Python爬虫]模拟登陆**查网站

本文详述如何使用Python的selenium库模拟登陆##查网站,获取企业信息。通过PyCharm和Firefox浏览器实现登录,并提供模拟登录函数的编写步骤,强调在大量数据爬取时可使用Phantomjs提升效率。
摘要由CSDN通过智能技术生成

这是一篇使用Python模拟登陆##查网站的详细介绍,##查网站上有许多的企业信息,因此抓取##查数据十分重要,本文使用selenium模拟登陆##查网站。
其实我之前就想写这个python模拟登录网站的,因为之前爬虫用的时候感觉还挺好用的,后来想学一下R爬虫再来用R写的,结果最近的爬虫还是用的python,so,给大家用python讲解咯。

今天给大家讲的是模拟登录“##查”这个网站,网站登录页面就是下面这样。

天眼查网站登陆页面

我们用的工具就是PyCharm编译器,类似于R里面的RStudio;

还有就是用Firefox浏览器,这是为了更好的展现结果,当你爬取的数据比较多的时候,建议用Phantomjs,这个无头浏览器爬取速度更快。
首先,导入需要用到的包,这里只有两个,一个是selenium包里面的webdriver函数,另一个则是time包。
然后,定义一个模拟登录函数,这里你需要准备的就是登录所用的账号密码。(原谅我把账号密码马赛克了一下)

模拟登陆代码

最后,直接调用定义的登陆函数就OK啦。
做完这三个部分,就完成了模拟登录。

评论 15
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值