python爬虫模拟扫码登录_Python爬虫模拟登录的黑魔法

今天用 requests + BeautifulSoup 抓取 aliexpress 的时候, 在模拟登录时候出现了很多问题, 提交数据时会对密码等一些字段加密, 而且提交一大堆不知名的字段, 大概有二十多项。 看到那么多字段, 整个人就不好了, 作为一个懒人, 准备绕过这个坑。

大概思路是这样, 通过 selenium 打开浏览器, 模拟登录。 获取cookies ,并将cookies以文件的形式保存到本地。 当我们使用requests打开页面的时候就可以用本地的cookies。 因为 通过selenium打开浏览器的方式登陆没有那么多限制, 只需要模拟登录流程( 输入帐号密码, 点击登录即可登陆)。 而且selenium可以模拟各种浏览器, 亦可以在命令行下实现浏览器功能。

1: 通过selenium 登录

from selenium import webdriver

from selenium.webdriver.common.keys import Keys

def login(username, password browser=None):

browser.get("https://login.example.com/")

pwd_btn = browser.find_element_by_name("password")

act_btn = browser.find_element_by_name("loginId")

submit_btn = browser.find_element_by_name("submit-btn")

act_but.send_keys(username)

pwd_btn.send

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值