验证码识别
关于验证码与爬虫:
验证码是一种反爬机制,
在我们登陆账号时,有时会需要输入验证码。
而我们要做的就是识别验证码图片中的数据,用于模拟登陆操作。
识别验证码的操作:
❀人工肉眼识别 (不推荐)
❀第三方自动识别 (推荐)
识别流程:
①获取需要识别的验证码图片
②构造函数,返回获取到的图片地址
③利用第三方软件识别
登陆流程:
①分析登陆时的流程
②点击登录按钮后会发起一个post请求
③post请求中会携带登陆之前录入的相关登录信息(用户名、密码、验证码…)
④验证码:每次请求都会变化
模拟登陆编码流程:
①识别验证码、获取验证码图片的数据
②对post请求进行发送(处理请求参数)
③对响应数据进行持久化存储