python3爬虫系列22之selenium模拟登录需要验证码的微博且抓取数据
1.前言
前面一篇说的是 python3爬虫系列21之selenium自动化登录163邮箱并读取未读邮件内容
,实际上呢,163的登录没有遇到验证码的问题。
现在写一个微博的自动登录的,注意这个是需要验证码的。很多网上的代码不适应了,微博代码已经改了,是最新的
2.网页分析
目标地址:https://weibo.com/
那么实际上现在的难点在于这个验证码怎么办?
3. 手动输入验证码版
这一块为讲selenium设置为开发者模式,防止被网站识别出来我们使用了Selenium爬虫。
# 进入开发者模式
options