Python爬虫验证码识别登录

本文介绍了使用Python进行爬虫时如何处理验证码识别,通过超级鹰平台解析验证码图片,并结合实例详细讲解了如何模拟登录人人网的过程。
摘要由CSDN通过智能技术生成

Python爬虫:验证码识别登录

获取验证码图片

import requests
from lxml import etree
url='https://so.gushiwen.org/user/login.aspx?from='
headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36'
    }
img_code_text=requests.get(url=url,headers=headers).text
tree=etree.HTML(img_code_text)
img_src_url='https://so.gushiwen.org'+tree.xpath('//*[@id="imgCode"]/@src')[0]
img_data=requests.get(url=img_src_url,headers=headers).content
with open('./code.jpg','wb')as fp:
    fp.write(img_data)
# print('存储成功')

超级鹰平台识别验证码图片

登录超级鹰官网,注册一个账号和密码,并在用户中心>>软件ID 生成一个软件ID

#!/usr/bin/env python
# coding:utf-8

import requests
from hashlib import md5

class Chaojiying_Client(object):

    def __init__(self, username, password, soft_id):
        self.username = username
        #更改点1
        password =  password.encode('utf-8')
        self.password = md5(password).hexdigest()
        self.soft_id = soft_id
        self.base_params = {
            'user': self.username,
            'pass2': self.password,
            'softid&#
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值