python 爬虫——模拟登录古诗文网

验证码识别

验证码识别需要借助第三方线上平台——线上的打码平台进行验证码识别。

因此,为了模拟登录,我们要做的就是将平台的验证码爬取下来,并利用线上识别平台完成验证码的输入,从而成功登录。

线上打码平台:

云打码:(貌似现在网站被封锁了)

超级鹰:(推荐使用)

打码兔等

超级鹰使用流程简单介绍:

注册:注册一个用户身份 完成登录

登录:登录后点击软件id——生成一个软件ID(931407)——下载示例代码(选择语言)

代码:(已经调试并成功运行)

#!/usr/bin/env python
# coding:utf-8

import requests
from hashlib import md5
from lxml import etree


class Chaojiying_Client(object):

    def __init__(self, username, password, soft_id):
        self.username = username
        password =  password.encode('utf8')
        self.password = md5(password).hexdigest()
        self.soft_id = soft_id
        self.base_params = {
            'user': self.username,
            'pass2&
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值