验证码和爬虫之间的关系
验证码是反扒机制
识别验证码图片中的数据用于模拟登陆操作
操作有两种:
人工肉眼识别 不推荐
第三方自动识别
云打码 注册 普通和开发者 看题分是否还有需要充值 开发者登陆 创建一个软件 点击我的软件
添加新软件录入软件名称
提供软件代码和通讯密钥
点击开发文档 下载实例代码 开发文档 下载云打码接口DLL选择Pythonhttp实例下载
三个组成 一个是2.x 一个是3.x 一个是验证码图片
分为两部分 一个是类
一个是可执行数据(需要修改的数据)
在用户名和密码填写云打码平台的普通用户名和密码 软件
第三个是软件id,云代码平台 开发者后台我的软件
有一个url去搜索偶验证码的类型
超时时间是识别验证码的时间 15-20
使用打码平台识别验证码的编码流程:
将验证码图片进行本地下载:
调用平台提供的示例代码进行图片数据识别