阅读本文需要5分钟
Python3爬虫实战【点触验证码】 — 模拟登陆bilibili
爬虫思路如下:
利用自动化爬虫工具 Selenium 模拟点击输入等操作来进行登录
分析页面,获取点触验证码的点触图片,通过将图片发送给超级鹰打码平台识别后获取坐标信息
根据超级鹰返回的数据,模拟坐标的点选,即可实现登录
一.准备工作
在开始之前,需要先注册一个超级鹰账号并申请一个软件ID,注册页面链接为:https://www.chaojiying.com/user/reg/,注册完成后需要在后台添加一个软件ID,进行充值获得积分,一般充一块钱就可以了。
二.爬虫构建
1.首先我可以到官方网站下载对应的 Python API,链接为:https://www.chaojiying.com/api-14.html ,我这里使用了崔庆才大大修改后的超级鹰api
代码如下:
import requestsfrom hashlib import md5class Chaojiying(object):def __init__(self, username, password, soft_id):self.username = usernameself.password = md5(password.encode('utf-8')).hexdigest()self.soft_id = soft_idself.base_params = {'user': self.username,'pass2': self.password,'softid': self.soft_id,}self.headers = {'