点上方蓝色“菜鸟学Python”,选“星标”公众号
重磅干货,第一时间到达
对于学习爬虫的小伙伴来讲,使用爬虫来登录各大门户网站,进而爬取网站中的一些内容信息,是非常普遍的事情。但是由于很多的网站设置很多的反扒和登录条件,导致小伙伴们在用爬虫登录网站的过程中,会花费大量的精力,非常痛苦。
今天,小编就带领大家来用GitHub上的开源项目,来直接登录各大网站,目前该项目已经超过了1万2千个star了。
01
项目介绍
这个项目已经为大家写了包括虾米音乐、知乎、淘宝、B站、微博网页版等25个网站登录程序。大家只需要根据自己的需求来将对应的项目添加到自己的程序中即可。项目中每个文件夹都对应着一个网站的登录,所以大家直接点进去不同的网站,然后使用程序即可。
对于登录的程序,作者使用了request、selenium等不同的库来实现的,大家需要提前配置好这些库。
为了让大家更好的更快的使用该项目,小编接下来带领大家来实操一把,看如何使用该项目。我们以GitHub账户登录为例,看看如何来登录。
02
实战GitHub账户
首先我们可以看到,程序是按照面向对象的方式进行编写的,程序首先构造请求头,然后让用户输入账号和密码。
需要注意的是,针对于其他的网站登录,该项目也大都是仅仅需要输入账户和密码,所以针对用户来说,非常的友好,大家只需要输入账户和密码,然后就可以一键登录网站。
03
模拟登入
由于GitHub的登录采用表单提交的方式,因此,程序首先构造了提交的数据表单,然后向服务端提交表单数据,并获取服务端返回的状态码,以此来判断登录是否成功。
04
程序演示
最后我们一起来看一下程序的演示效果,这个库可以爬很多网站,下面只是演示其中的一个网站。
对爬虫有兴趣的小伙伴可以下载,学习一波,也欢迎大家在留言区吱一声,记得给小编三连哦!
项目的地址:
https://github.com/Kr1s77/awesome-python-login-model
推荐阅读
每个程序员都是从菜鸟开始成长起来的,没有人生下来就是程序员高手。菜鸟编程大本营,专注于分享趣味的编程技巧,不限于Java, Python ,Go, Javascript等语言,让菜鸟爱上编程,进阶成为高手。
菜鸟编程本营,从菜鸟进阶高手
点这里,获取新手福利