验证码和爬虫之间的爱恨情仇?
反爬机制:验证码。识别验证码图片中的数据,用于模拟登陆操作。
识别验证码的操作:
- 人工肉眼识别;(效率低,不推荐)
- 第三方自动识别:云打码(推荐)
url:https://www.yundama.com/demo.html(已经挂了)
云打码的使用教程:
- 注册:普通用户和开发者用户
- 登录:
普通用户登录:查看是否还有剩余的提分
开发者用户登录:
1.创建一个软件:我的软件->添加新的软件->录入软件名称->提交(软件id和密钥)
2.下载示例代码:开发文档->点击下载:云打码接口->pythonHTTP示例下载->
使用打码平台识别验证码的编码流程:
- 将验证码图片下载到本地
- 调用平台提供的示例代码进行图片数据识别
实例:
# -*- coding = utf-8 -*-
# @Time :2021/4/322:01
# @Author : LvXin
# @File: 古诗文网验证码识别.py
# @Software: PyCh