往期精彩
前言
在日常数据分析中,我们或多或少都会到网上抓取一些数据,比如豆瓣(封ip)、微博(要登陆)、淘宝等等,但是这些网站在非登录的情况只能拿到部分数据,有很多数据都是需要登陆之后才可以获取的,那么模拟登陆就成为了爬虫的第一步,通过代码来模拟登陆目标网站,然后爬取数据;但是有时,我们可以通过python神奇的库功能来完成,今天推荐的这个工具就很不错。
工具介绍
工具名称:DecryptLogin
GitHub 地址:
https://github.com/CharlesPikachu/DecryptLogin
这是一个一键式登陆各大网站的工具,代码量少(符合python特点),如果去除 import 和初始化代码,则完全实现了1行代码登陆网站。
微博登陆
评论分析,自然语言处理,肯定少不了微博的
可以看到,首先初始化一个 login 实例,然后方法 weibo 即可,这个时候会弹出登陆二维码,直接扫描登陆就可以获取到对应的登陆信息了
GiHub
哔哩哔哩
结语
大家自行官网查询用法,我这就不一一说明