一、超级鹰平台
所谓的打码平台,,它的作用就是在我们爬虫过程中,解决验证码校验的一个工具。
这个工具可以自动识别验证码图片,并返回验证码图片的内容
http://www.chaojiying.com/
1.注册
2.查看API
二、案例
只需要通过传入所需要的参数,即可解析返回验证码图片内容
import requests
import base64
#http://my.cnki.net/Register/CheckCode.aspx
def verify_code(imge_filename,code_type='1004'):
'''
:param imge_filename: 验证码图片文件路径
:code_type='1004':验证码的类型,1004:1-4为英文数字,详细请查看:http://www.chaojiying.com/price.html
:return: 验证码图片的内容
'''
base_url = 'http://upload.chaojiying.net/Upload/Processing.php'
fp = open(imge_filename, 'rb')
imag_str = base64.b64encode(fp.read())
# 0
data = {
'user': '超级鹰用户名',
'pass2': '超级鹰密码(MD5形式)',
'softid': '软件ID',
'codetype': code_type, # 验证码的类型
'file_base64': imag_str,
}
response = requests.post(base_url, data=data)
# print(response.json())
if response.json()['err_no'] == '0':
return response.json()['pic_str']
if __name__ == '__main__':
# fp = open('CheckCode.png','rb')
filename = 'code.png'
code_str = verify_code(filename)