ks滑块verifyParam分析以及思路讲解#web端验证码#文字点选#个人记录

声明:该文章涉及的所有案例均为个人学习记录使用,严禁用于商业用途和非法用途,否则

由此产生的一切后果均与作者无关!如有侵权,请私信联系本人删帖!

目录

一、verifyParam加密流程分析。

二、明文参数分析

三、canvas指纹动态模拟。

四、遇到的坑点记录

坑点一:

坑点二:

五、深度学习

5.1 滑动验证码

5.2 文字点选验证码

5.3 旋转验证码

六、结语


一、verifyParam加密流程分析。

全局定位搜索verifyParam发现其值等于a,往上跟栈可以知道a = e[Jt("0x3a")],其中Jt("0x3a")等于send,也就是接收上一步返回过来的值。

c449406f39184fc7874d33642530457a.png

我们接着分析可以知道case0中next等于3,也就是说a最后是case0中返回过来的,也就是i[Jt("0x34")](Xt["a"], c);返回的值。

2206d84dba3c4799a6f9359b3d2cd36d.png

我们接着分析i[Jt("0x34")](Xt["a"], c);  可以比较容易的知道就是执行了Xt["a"],c是这个函数的参数,c也就是我们的明文参数。因为是异步执行了,我们需要跟进去看看异步内部的逻辑,直接跟进Xt["a"]函数。(v[r("0x0")](this, arguments)简化下就是v.apply(this,arguments),就是执行了v函数,v函数就在下面,需要第一次刷新页面的时候才会进入到下面的v,也就是完成初始化的过程,后面再次滑动在v函数里面是断不住的)

44378db81040457f8b6d1a82090755b8.png

不管是第一次刷新还是后续的滑动,最终都会进入到核心的加密位置,也就是下面的switch语句中完成最后的加密过程。

5266222f1ade462991f7fd2ef7200dbc.png

我们接着分析明文的加密过程,

function h(e) {
    var n = {};
    n[r("0x26")] = function (e, n) {
        return e < n
    }
    ;
    for (var t = e[r("0x27")], c = new Uint8Array(t), a = 0; n[r("0x26")](a, t); a++)
        c[a] = e[r("0x28")](a);
    return c
}


//  关键加密伪代码
return regeneratorRuntime[r("0x30")]((function (t) {
    while (1)
        switch (t[r("0x31")] = t[r("0x1a")]) {
            case 0:
                return i = a.a[r("0x32")](c),  // 对明文c就行序列化,即执行JSON.stringfy操作
                    o = h(i),  // 将序列化的c进行Uint8Array 操作
                    t[r("0x1a")] = 4,  // 下一轮进入case4
                    n[r("0x29")](x, o);  // 执行x(o),并返回给case4中的u  u
            case 4:
                return u = t[r("0x33")],  // 接收case0最后返回过来的值
                    t[r("0x34")](n[r("0x2a")], e[r("0x35")](u)[r("0x36")](r("0x37")));  // 最终返回的值,对接收的u进行Uint8Array操作后转base64编码
            case 6:
            case n[r("0x2c")]:
                return t[r("0x38")]()
        }
}

case0中的n[r("0x29")](x, o);是比较关键的加密过程,跟进去x可以看到其为异步操作,通过补环境导出Jose即可。

8c3ff75b782944b8b7c1a50664022ed3.png

进一步分析可以知道Jose在088e中,一个典型的字典类型的webpack,没啥难点,一个字 “扣”

15d27bf171914ba4b66af71101ae4e8f.png

总结下大致的加密过程,1.明文参数进行序列化。2.转Uint8Array。3.经过Jose进一步加密。4.在转Uint8Array。5.最后进行base64编码。

二、明文参数分析

{
    "captchaSn": "Cgp6dC5jYXB0Y2hhEu4CX8zQ7Opapg7Ej91Ar7N8c5Jc5KJvzG9jT0dLyY2wFjRx4S3L8HEr3Ijx1QaPQ26dpqHYsZ8EsIXMkosfiSGuqg1WKFhy9-A7EGO0l62mlUeZfHLVTugLiQpkc6MjCml3mq0OqIjCkVAslgxzIH4p4BWWDUQnQFqMC9Oicp0NqX7xdzsDdx8UYkBQ0_pHP6tnM4OnjeLycHDvHWEJ6VbWNYpQ7DtCng7SdCKpmpCTUFQUobYbQnEgaLb9dMWtJsM1vSieL0fTQ9R2qbCOwjIRtWNgf7arHChFSKPELv8lzMcRjs1ffHS0UpNBP0Pb--JjGXomqSBDkEXRe6l7BwoD1bULNnYwRt-FzPlDs4OTshpLskqF9Kx18BbHQNiwWXwAt6_U_x1eNqlCnr-QJtUCt_lXxksXdtgfoTrQOwrJTa44e4lOw-YAJlWYWlaJ6e57RWCj0CeXXs8rwwRqKqLz_G5oMzsv4EJg-uvTfJJAGhIMBkxCONRI4rqzJJkPiSSCZoMoBTAC",
    "bgDisWidth": 316,
    "bgDisHeight": 184,
    "cutDisWidth": 56,
    "cutDisHeight": 56,
    "relativeX": 147,
    "relativeY": 67,
    "trajectory": "0|24|0,21|24|12,36|24|20,43|24|28,61|24|36,94|24|40,137|23|48,192|22|56,246|20|64,304|19|76,355|17|84,405|15|92,449|12|100,492|11|108,521|10|116",
    "gpuInfo": "{\"glRenderer\":\"WebKit WebGL\",\"glVendor\":\"WebKit\",\"unmaskRenderer\":\"ANGLE (NVIDIA, NVIDIA GeForce RTX 4060 Laptop GPU (0x000028E0) Direct3D11 vs_5_0 ps_5_0, D3D11)\",\"unmaskVendor\":\"Google Inc. (NVIDIA)\"}",
    "captchaExtraParam": "{\"ua\":\"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/129.0.0.0 Safari/537.36 Edg/129.0.0.0\",\"userAgent\":\"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/129.0.0.0 Safari/537.36 Edg/129.0.0.0\",\"timeZone\":\"UTC+8\",\"language\":\"zh-CN\",\"cpuCoreCnt\":\"16\",\"platform\":\"Win32\",\"riskBrowser\":\"false\",\"webDriver\":\"false\",\"exactRiskBrowser\":\"false\",\"webDriverDeep\":\"false\",\"exactRiskBrowser2\":\"false\",\"webDriverDeep2\":\"false\",\"battery\":\"1\",\"plugins\":\"1a68ba429dd293b14e41a28b6535aa590\",\"resolution\":\"2048x1152\",\"pixelDepth\":\"24\",\"colorDepth\":\"24\",\"canvasGraphFingerPrint\":\"104448240937f45b2ccc629cd5715ee6e\",\"canvasGraph\":\"104448240937f45b2ccc629cd5715ee6e\",\"canvasTextFingerPrintEn\":\"1f4e7253d49f58f5f0cc44483e386e1ac\",\"canvasTextEn\":\"1f4e7253d49f58f5f0cc44483e386e1ac\",\"canvasTextFingerPrintZh\":\"1217ee88e0a133c462ed93349c723313f\",\"canvasTextZh\":\"1217ee88e0a133c462ed93349c723313f\",\"webglGraphFingerPrint\":\"18bb529a12fbb538d8e222a77c7c5498c\",\"webglGraph\":\"18bb529a12fbb538d8e222a77c7c5498c\",\"webglGPUFingerPrint\":\"1b044dae07989c58fdcc978c600d33711\",\"webglGpu\":\"1b044dae07989c58fdcc978c600d33711\",\"cssFontFingerPrintEn\":\"10a344f5534d5b367655c7f90f04de717\",\"fontListEn\":\"10a344f5534d5b367655c7f90f04de717\",\"cssFontFingerPrintZh\":\"16c1334aeae228bca19e18632c8472a52\",\"fontListZh\":\"16c1334aeae228bca19e18632c8472a52\",\"voiceFingerPrint\":\"1dd96cac4e826abdbbe261dc4f3a08292\",\"audioTriangle\":\"1dd96cac4e826abdbbe261dc4f3a08292\",\"nativeFunc\":\"1973dcbb27a04c3a2ee240d9d2549e105\",\"key1\":\"web_f8f6a11a02509dd0e231b3733bc1a307\",\"key2\":1728202167871,\"key3\":\"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/129.0.0.0 Safari/537.36 Edg/129.0.0.0\",\"key4\":\"20030107\",\"key5\":\"zh-CN\",\"key6\":\"Gecko\",\"key7\":2048,\"key8\":1152,\"key9\":2048,\"key10\":1104,\"key11\":360,\"key12\":360,\"key13\":1102,\"key14\":2046,\"key15\":\"00000111\",\"key16\":1,\"key17\":1,\"key18\":[],\"key19\":{},\"key20\":[],\"key21\":{},\"key22\":[],\"key23\":{},\"key24\":[],\"key25\":{},\"key26\":{\"key27\":[\"0,1,32,2,266,prepare1\",\"1,1,40,6,266,prepare1\",\"2,1,48,12,266,prepare1\",\"3,1,56,15,266,prepare1\",\"4,1,64,22,267,prepare1\",\"5,1,77,29,267,prepare1\",\"6,1,82,30,267,prepare1\",\"7,1,176,30,272,prepare1\",\"8,1,185,28,275,prepare1\",\"9,1,192,28,282,prepare1\",\"10,3,560,27,297\",\"11,1,568,27,296,prepare2\",\"12,1,577,28,296,prepare2\",\"13,1,584,34,296,prepare2\",\"14,1,592,37,296,prepare2\",\"15,1,600,41,296,prepare2\",\"16,1,608,47,298,prepare2\",\"17,1,616,59,298,prepare2\",\"18,1,624,74,300,prepare2\",\"19,1,632,88,301,prepare2\",\"20,1,640,103,301,prepare2\",\"21,4,696,114,301\",\"22,2,748,114,301,prepare3\",\"23,1,749,114,301,prepare3\"],\"key28\":[],\"key29\":[],\"key30\":[],\"key31\":{\"prepare1\":\"9,1,192,28,282\",\"prepare2\":\"20,1,640,103,301\",\"prepare3\":\"23,1,749,114,301\"},\"key32\":{},\"key33\":{},\"key34\":{}},\"key35\":\"cd84b9229fa7c7a2e31bbc574fd37c42\",\"key36\":\"f22a94013fc94e90e2af2798023a1985\",\"key37\":1.25,\"key38\":\"not support\",\"key39\":16}"
}
  • captchaSn为图片接口返回。
  • bgDisWidth为固定值
  • bgDisHeight为固定值
  • cutDisWidth为固定值
  • cutDisHeight为固定值
  • relativeX滑动距离
  • relativeY为图片接口返回的disY*0.46
  • trajectory滑动轨迹,重点,直接影响滑块的成功率
  • gpuInfo显卡信息,可固定
  • captchaExtraParam浏览器指纹,可模拟

经过我不断的尝试,浏览器指纹可以动态变得有以下几个值:

  • ua
  • userAgent
  • canvasGraphFingerPrint
  • canvasGraph
  • key1
  • key2
  • key7-key14  屏幕宽度相关的

其实浏览器指纹直接写死应该问题也不大,但是注册did高并发下可能会影响实际的成功率,因为长时间使用同一指纹请求,会导致指纹短时间内被封,即使是做了本地的指纹库,也会导致指纹短时间用不了,所以上述的几个值还是需要动态变化的,其中canvas指纹一定要动态变化下,关于如何变化,下文会讲,反正比较玄学的。

三、canvas指纹动态模拟。

全局搜索captchaExtraParam,有三位置,找到下图的位置,分析过程和verifyParam差不多,都是异步中加密的。

825deda05b28450f8440ce1811045daf.png

进度Ga,在进入下面的Ea

bbdeecb1ad2346e1897a9a58c483d566.png

Ea中的switch就是关键的加密位置

ddfeca91621b4479b73680b2895bbcb9.png

其中的e[pa("0x65")](ua);就是加密位置,也是异步操作,跟进去ua看看里面是怎么执行的。跟进ua后在跟进oa,由此定位到具体的加密位置

4349dba6ff924fa5a3d3a34a337d3e57.png

下面分析下oa

function oa() {
    return ac(this, void 0, void 0, (function () {
            var e;
            return ic(this, (function (n) {
                    switch (n.label) {
                        case 0:
                            return [4, ra()];  // ra()生成了所有的加密值
                        case 1:
                            return e = n.sent(),
                                [2, e.reduce((function (e, n) {
                                        var t = n.name
                                            , c = n.hash;  // 循环赋值
                                        return e[t] = c,
                                            e
                                    }
                                ), {})]
                    }
                }
            ))
        }
    ))
}

进入ra,发现是hash中进行了进一步的加密,是个循环,依次对值就行了加密

3eb0ca73ce634ae9896e7fac74644709.png

进入ca,进一步在ta中进行了加密,再次分析就一目了然了。

82787c2fd6054f83877b5c5fac171039.png

也就是浏览器画了个图,将图片的base64进行了加密,



92b4f883788746548fcdcd52f443119e.png

3ae11da0400045c4a5bc14c69b2e8ee6.png

进一步进入ta,发现不像是标准的MD5加密,具体是啥加密我也不知道,不管三七二十一,我们扣下加密函数不就行了。

3c0bd624babe4cf68da48d520ff3ae8e.png

加密方法也不多,几十行就可以解决了。

a5d07a70248145ce800cf34d2ebad6b5.png

比较玄学的问题来了,实际上,我在实际动态模拟的过程中发现,使用任何值进行加密,生成的canvas指纹也能用,而且不用上述的加密方法,直接用标准的md5加密也可以使用。

四、遇到的坑点记录

坑点一:

快手滑块主要用于did注册,用于后续的数据采集,did注册用到了几个接口,评论接口、视频列表接口,其中评论接口过了滑块后还会出文字点选或者旋转的验证码,视频列表接口过一次就好了,但是要注意一个坑点,一般出现滑块会有两种响应包,

响应包体一

{
    "errors": [
        {
            "message": "Need captcha",
            "locations": [
                {
                    "line": 2,
                    "column": 3
                }
            ],
            "path": [
                "visionConfig"
            ],
            "extensions": {
                "code": "GRAPHQL_VALIDATION_FAILED"
            }
        }
    ],
    "data": {
        "visionConfig": null,
        "captcha": {
            "jsSdkUrl": "//static.yximgs.com/udata/pkg/fe/indentity-verification.umd.f6645615.js",
            "url": "https://captcha.zt.kuaishou.com/iframe/index.html?captchaSession=Cgp6dC5jYXB0Y2hhEqYCZJVYpHaI7bzG_s0N4WflPRnJbPOF7x3hMhJQuuMwXPDNYD6caALGzGegytSX_YBiVHnLNIHrRP_DtOhSCMTM7oKux_IcWiq7jwiaZ9i3neVbajc7cSZmn7iWr9PqxhZKXGgiSazo9H6uiQiaiBLDhybMSrr67cSM5XFl2T3V0lrUes_GMRxJnXihIld3fIiAEzp8MQqmdc84437iUmDX8ssggnP95mgbd7NXQ4uB6nrwBJcLWeD9JOTl5fUSyk1wBQOC7CCfagb1VZ4rX4gKdZWjYz1gjYk5ESTfanrjJZABy9GCZMH16AOScw2h4uvR26QgnTV9lU3sEhXwimWLDoRIvkvR6dgWRpiaDP6M-Z_ltfZY0iP9aRFO2OG8Z7dxmaU88gzmGhJxat9v18_vGhz0w0fGzFHTlSooBTAC&type=1&configUrl=https%3A%2F%2Fcaptcha.zt.kuaishou.com%2Frest%2Fzt%2Fcaptcha%2Fsliding%2Fconfig&bizName=ANTICRAWL_COMMON"
        }
    }
}

 响应包体二

{
    "data": {
        "result": 400002,
        "jsSdkUrl": "//static.yximgs.com/udata/pkg/fe/indentity-verification.umd.f6645615.js",
        "url": "https://captcha.zt.kuaishou.com/iframe/index.html?captchaSession=Cgp6dC5jYXB0Y2hhEogCL8jHHY-VWZmt8n19baxMNrqgVTpsLwZImMvAtGOERLrA4W0XgZFA4fLl1vh3nkUqZB4qpaj2q7MILVsTOZGavmT0xd0FdxacFndkQwjUDXORDGGPUw0VrVrV-JyzBqnRNSIOqYE6gtZ2dUDuCSoltqjyp3wM9BEbu_hwSOGUkuBOuzJPiBP-ZaG2zAuBTN_xRMWCAqiBXSNn3eG9H2WCyEKESh4cHRzzBErexQiI0p75bb-3pYRuX3L4t6tm1EtWhxaiazc4M-0-r4dpHCE3nO4oDyBbj_vDaoX-RnCMR0tyqDjuZpDiX0AQWX1jWbaYOYVsXs1VtadmWVSKwZtSKBRXrmMh3lgDGhIi_VYjwd6wf-ZmHqT8QvBDmRsoBTAC&type=1&configUrl=https%3A%2F%2Fcaptcha.zt.kuaishou.com%2Frest%2Fzt%2Fcaptcha%2Fsliding%2Fconfig&bizName=ANTICRAWL_DEFAULT"
    }
}

上述两种响应包体,只有第一种生成的captchaToken才可以直接使用,第二种即便生成了captchaToken也是需要再次过一遍滑块的。我这边生成did和生成captchaSession的时候,用了sesson请求保持两个请求之间的会话,同时使用了快代理,这样每次请求返回的captchaSession响应体都是第一种情况了,避免了二次过滑块的情况。目前过了滑块后需要用captchaToken去激活did,其中激活之前,需要模拟一下log日志发包,一定要模拟,一定要模拟,一定要模拟,重要的事情说三遍,不模拟did激活不了,用一次后面就无法使用了,这个问题坑死我了。

log日志包接口:https://gdfp.gifshow.com/p/z/s

d536678b84ec4a5fa62340a6948c817d.png

坑点二:

一直返回350014,除了轨迹的问题之外,就是浏览器指纹被黑了,还是需要动态模拟下canvas指纹的。

826312440cf74f739b5c088248f34dd4.png

五、深度学习

由于最开始的时候使用评论接口注册did,过了滑块之后一直出文字点选和旋转验证码,一气之下,就将文字点选和旋转也都搞定了,识别打码这块也都是自己训练的模型,模型训练这块总体来说难度也不是很大,毕竟都是使用的开源框架进行训练的,没有什么很大的技术含量,这里简单的记录一下吧。

5.1 滑动验证码

直接使用yolov5划分训练集和测试集,大概10:1的一个比例吧,我这边训练集标注了500张左右的图,测试集标注了50多张,总体训练下来识别准确率接近100%了。

664db262ed0d455fa1ae058689e51768.png

5.2 文字点选验证码

文字点选稍微复杂些,主要体现在数据集的准备上,我光准备数据集就花了将近两个星期,因为要上班,都是业余时间准备的,算是比较的费时费力,本来是想着自己慢慢标注的,但是文字这块实在太多,最后还是妥协用了超能力准备了将近2万多个文字单图,简单说下文字点选的处理思路,第一步需要使用yolov5切割下来背景图上的文字,然后将文字与目标文字进行相似度匹配,匹配出点击顺序,所以文字点选这块训练了两个模型,一个yolov5做目标检测,一个孪生神经网络模型做相似度匹配。

yolov5训练集

b23288d57be64f0ba47fe82066ec37c9.png

孪生神经网络模型训练集

1cd5f7a034484085954cf0ea907c9d93.png

使用到的开源模型地址:

5.3 旋转验证码

基本原理就是使用cnn神经网络做角度的预测,快手的原图大概32个,基本思路就是对这32个原图依次进行360度旋转然后丢进框架里面训练,32个原图准备下来的训练集大概11520张。

旋转原图

21f74ba559994beea9ab6a70fa71fe90.png

训练图

6608e3fb60bd4852b31917624fb01c95.png

 使用到的开源模型地址:

GitHub - 8yteDance/RotateCaptcha: 基于CNN的旋转验证码通用解决方案,附带标注系统,适用于小红书、百度、抖音等,速度快误差小,效果非常的棒棒!

六、结语

快手整体的难度不大,我完成verifyParam参数加密不到1天弄完,但是到生产环境中具体应用,前后经历了将近一个月,里面的坑还是比较多的,总体来说收益还是比较大的,模型训练这块也是基本能够略懂一二,包括将训练出的.pt模型转.onnx本地部署使用,过程可以说也是比较艰难,到处百度查资料,真就应验了那句话,“我不是代码的生产者,我只是百度上的搬运工”,那么最后看下我的成果展示吧。

多线程批量注册did

2a46eca674804ab183ca3ca3ede21c97.png

 24小时注册使用,根本不成问题,一个did可以使用10来次,生成环境够够的。最近在整ast,有没有志同道合的朋友可以一起交流学习啊,此文发表的时候,刚入行一年半吧(本人科班毕业),很多东西还是不太会,还得继续学,共勉。

Python可以用来编写自动化脚本来控制浏览器操作,实现快速浏览快手极速版并访问个人作品的功能。这通常涉及到使用像Selenium这样的Web自动化库,配合如ChromeDriver等浏览器驱动。以下是一个简化的步骤: 1. 安装必要的库:首先安装selenium、webdriver_manager(用于管理浏览器驱动)以及相关的网络请求库(如requests),例如: ```shell pip install selenium webdriver_manager requests ``` 2. 导入所需模块: ```python from selenium import webdriver from webdriver_manager.chrome import ChromeDriverManager import time ``` 3. 初始化浏览器驱动: ```python driver = webdriver.Chrome(ChromeDriverManager().install()) driver.get("https://kuaishou.app/your_username") # 用实际账号替换your_username ``` 4. 自动滚动浏览页面和个人作品列表: ```python def scroll_to_bottom(driver): last_height = driver.execute_script("return document.body.scrollHeight") while True: driver.execute_script("window.scrollTo(0, document.body.scrollHeight);") time.sleep(1) # 控制滚动速度 new_height = driver.execute_script("return document.body.scrollHeight") if new_height == last_height: break last_height = new_height scroll_to_bottom(driver) ``` 5. 查找并点击个人作品链接: ```python works_list = driver.find_elements_by_css_selector('.personal-work-item') # 需要根据实际HTML结构调整选择器 for work in works_list: work.click() time.sleep(2) # 让每个作品停留一段时间再继续下一个 ``` 6. 关闭浏览器: ```python driver.quit() ``` **注意**:实施上述代码需要遵守快手平台的使用协议,并且在某些情况下可能会因为频繁的自动化操作而被封禁。此外,由于快手的反爬虫策略,直接模拟用户行为可能会遇到困难,实际效果取决于快手平台的动态更新。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值