目标网站:古诗文网
目标网址:http://so.gushiwen.org/user/collect.aspx
任务要求:
(1)通过selenium的方式模拟该网站的登录,并成功输入用户名和密码;
(2)保存验证码图片,并使用输入式验证码识别的方式识别验证码的文字,获取后输入到输入框中,
(3)验证登录是否成功。
由于OCR库识别成功率较低,这里我门借助超级鹰打码平台(自选平台也可)。
超级鹰平台地址:http://www.chaojiying.com/
ps:注册账号,关注微信号送1000题分
连接超级鹰的代码,详情获取请看我的另一篇博客python验证码识别如何连接第三方平台-------超级鹰
import requests
from hashlib import md5
class Chaojiying_Client(object):
def __init__(self, username, password, soft_id):
self.username = username
# todo:更改点一
self.password = md5(password.encode("utf-8")).hexdigest()
self.soft_id = soft_id
self.base_params = {
'user': self.username,
'pass2': self.password,
'softid': self.soft_id,
}
self.headers = {