我们在利用requests库发送请求时常遇到接口加密,cookies,js混淆等等问题。这个时候,推荐简单粗暴的selenium库来实现获取网页信息,就不用为反爬而发愁。(当然有些网站也会对selenium来做一些反爬措施)
1. selenium模拟登陆
1.1 安装
安装命令很简单,在terminal中执行下面这条命令即可。或在pycharm中setting>Project>Interpreter里面下载
pip install selenium
1.2 获取元素
- 首先导入
from selenium import webdriver
- 实例化
driver = webdriver.Chrome()
- 打开URL
driver.get('https://www.zhihu.com/signin')
- 定位登陆信息(以知乎为例)
us