众所周知,验证码的出现是为了区分人和机器,但随着科技的发展,黑产从业者的可图之利增多,验证码的战场也进入了一段破解与抗破解的持久博弈。
验证码在逐渐复杂的同时,黑灰产的攻击手段也不断提升。本文就从验证码与打码平台的对抗讲起。
何为打码平台?
打码平台的基本原理是利用人工智能技术实现对验证码设计原理的突破。
其工作流程如下图所示:
以前黑灰产要想获取数据,首先会向自己想要获取的数据页面发送请求,若该数据页面没有任何对于黑灰产的防护机制的话,那么黑灰产轻而易举的就能获取到数据;反之如果该数据页面存在验证码防御机制,那么在黑灰产获取数据的时候不会直接就返回数据,而是先弹出一个验证码作为人机验证的条件,只有通过了这个验证码的识别才返回数据。对于一般的黑灰产而言,其是没有应对验证码手段的,于是就获取不到数据。
打码平台的出现则解决了这一问题。黑灰产把获取到的验证码相关信息提交至打码平台,打码平台负责破解验证码,然后把正确的验证结果返回给黑灰产,让黑灰产在带着正确的验证结果去请求数据页面,大大加大了验证码被破解的风险。
综上,原本的请求流程只有黑灰产和数据页面的双向通信,由于打码平台的加入,现在这条链路上便演变成了黑灰产、数据页面、验证码、打码平台四者之间的通信。
打码平台是如何破解验证码的?
那么,打码平台是如何高效的破解市面上各家验证码平台的各种形式验证码的?
其优势主要表现为以下两方面:
时效性:
在打码平台破解各家验证码平台的验证码时,验证码平台也不会坐以待毙,其会推出新的验证码形式或者在原有验证码形式上提升验证难度。当验证码平台在这两个方向发力时,会导致打码平台破解验证码的难度上升,如果打码平台能快速攻破,则说明时效性高,调整时间短,阻塞黑灰产爬取数据的时间自然也会大大缩短,不然会导致黑灰产被阻塞于验证码这堵高墙外。
高效性:
黑灰产在获取到验证码相关数据时需要提交给打码平台进行破解,然后获取到破解信息后在去数据页面进行验证。如果打码平台对于验证码的单次破解时间长(效率差),比如滑动验证码破解需要1ms ,点选验证码破解需要10ms