码王吴彦祖-CSDN博客

原创 OCR在线识别网站现已上线！

由作者亲自开发的ocr识别网站哈哈，暂时汇聚了三十多种验证码模型以及算法，欢迎各路朋友去尝试，包括但不限于： - 四六位验证码 - 不定长验证码 - 计算题验证码 - 滑块验证码 - 图标点选验证码 - 文字点选验证码 - 分类选择验证码 - 其他验证码

2024-09-10 18:14:54 2313 5

原创利用PaddleOCR识别增值税发票平台验证码（开箱即用）

下面直接讲解利用paddleocr识别的思路，为什么使用paddleocr，因为paddle中集成了较好的ocr文字识别模型，开箱即用即可，废话不多说，剑指主题，识别思路步骤如下。

2023-05-25 21:50:21 5414 9

如何创建一个聊天自动回复的微信机器人（一）这里，本来打算用一个微信号来做机器人的，但是机器人有几个缺点1、如果任意一个人想使用机器人的话，那么必须添加机器人为好友才能使用测试2、基于微信识别异常微信号的自动检测，机器人很有可能被封号o(╥﹏╥)o3、现在想使用微信号做机器人的话，后端对接微信的方法大概有两种，一是使用网页版微信的API进行接入，不过现在网页版的微信已经封的差不多了，这种方法已经过时了，二是使用微信注入dll的方式来对接，不过这种方式也同样会受到微信的异常号自动检测，也会容易封号所

2021-02-22 14:19:53 8087 4

原创树莓派4B 极简安装教程（通俗易懂）

树莓派4B 极简安装教程（通俗易懂）既然是极简，那么所需要的的工具也是极简：PS：这里树莓派使用笔记本电脑进行安装配置1、树莓派4B 主板2、8G以上tf卡3、读卡器4、typec 电源线5、网线6、笔记本电脑一台下面是成果1、tf卡写入系统用你的tf卡插入读卡器写入一个系统即可，这里自由选择你想要安装的系统树莓派镜像下载这两个或者镜像页面下面的的操作系统都可以，这两个是标准系统，黑色的NOOBS更推荐新手使用，下载好系统后使用烧录工具把系统烧录到tf卡里面就行，这里的烧录工具

2020-09-03 00:10:51 6907 2

原创 Centos7.5 服务器搭建Selenium 爬虫详细教程

Centos7.5 服务器搭建Selenium 爬虫详细教程测试成功时间2020.03.121.安装python我安装的是python3.6需要给服务器安装Python环境最新的EPEL 7仓库提供了Python3（python 3.6）的安装源，如果你使用CentOS7或更新的版本的系统你也可以按照下面的步骤很轻松的从EPEL仓库安装。安装最新版本的EPELsudo yum ins...

2020-03-12 00:35:05 1526

原创从0搭建一个邮件服务器（用于邮件推送以及邮件群发业务）

本文讲述如何方便快捷搭建一个邮件服务器，由于本人论文以及实习公司需要，将会言简意赅的搭建一个邮件服务器来实现所需功能，以下是实现效果图

2020-02-13 01:57:49 10299 2

原创 Python模板匹配识别计算题验证码：固定场景下的轻量OCR识别方案

本文介绍了一种基于模板匹配的轻量OCR方案，适用于固定样式的计算题验证码识别。该方案针对图片尺寸一致、内容结构固定、字符集小的特点，通过区域切分、前景提取、归一化处理和模板匹配四个步骤实现高效识别。核心优势在于搜索空间小（仅需比较10个数字和3个运算符）、处理速度快且实现简单，特别适合验证码、题库截图等固定场景。文章详细阐述了从图片切分到结果匹配的全流程，并分析了该方法的适用边界，强调其在固定布局、稳定字体场景下的高效性，同时指出不适用于复杂多变的情况。

2026-06-15 15:31:32 60

原创某营业厅强混淆逆向分析

这篇文章摘要总结了分析网络请求加密机制的完整方法论。作者通过8个步骤系统性地拆解了请求-响应闭环：从观察请求异常现象开始，逐步定位统一处理层，分离URL和body处理逻辑，分析动态因子特征，最终结合响应解包逻辑验证加密机制。整个过程强调对比实验和动态观察，而非静态分析代码，尤其关注路径参数与请求体的关联性、密文结构特征以及请求-响应的上下文依赖关系。该方法不仅能识别加密算法，更能理解整套通信协议的设计逻辑，包括失败处理机制的状态机特性。

2026-06-10 15:18:31 552

原创某税务盾山请求签名与补环境分析

文章摘要该税务系统采用多层组合式安全防护机制，包含请求改写、运行时注入、数据加密、URL校验、Cookie联动和指纹验证等技术。核心流程包括：动态初始化运行时环境、请求体加密处理、URL参数绑定校验、请求头签名生成。系统特点为：签名逻辑动态注入而非静态代码、请求参数与会话状态强绑定、浏览器指纹参与签名计算。逆向分析需还原整体状态机而非单个算法，需特别注意动态密钥派生、URL参数混排逻辑以及运行时环境完整性补全。防护机制通过多层校验确保请求合法性，任何环节缺失都会导致签名失效。

2026-06-10 14:45:22 446

原创 JD滑块验证码逆向全流程分析

摘要该文分析京东滑块验证码的完整逆向流程，分为5个关键阶段：1）登录页初始化获取会话标识；2）提交设备指纹(fp)请求获取盐值；3）首次校验(check)获取滑块图片；4）本地识别缺口并生成轨迹；5）二次校验完成验证。核心围绕三类加密字段（tk、ct、cs）展开，分别绑定业务载荷、设备指纹和环境特征。文章详细解析了各阶段参数传递关系，包括设备信息(devcInfo)的组成、加密字段的生成逻辑（如ct由设备信息派生，tk绑定会话和盐值），以及轨迹生成的样本重建机制。最终通过绑定验证码实例ID(ii)和构造业

2026-06-08 11:18:28 593

原创京东旋转验证码识别2：基于多配置环带接缝匹配的旋转验证码还原算法

本文提出了一种改进的京东旋转验证码识别算法，通过环带接缝匹配和多配置投票机制显著提升了识别效率和准确率。算法核心思想是将二维旋转问题转化为一维角度序列匹配，仅比较背景圆环外侧和小图圆环内侧的特征序列，避免了整图旋转合成的计算开销。实验表明，该方法在30毫秒内即可完成识别，且对背景纹理干扰和对称结构具有更强的鲁棒性。相比传统暴力旋转评分法，新算法更贴近旋转验证码的本质特征，实现了速度和精度的双重优化。

2026-05-27 15:24:25 1223

原创 AI逆向 PDD 滑块验证链路全流程分析

PDD滑块验证全流程分析摘要 PDD滑块验证流程包含9个关键步骤，涉及多种加密技术和动态参数。核心流程包括：获取服务端时间→生成环境签名→预检接口建立会话→构造准备态行为体→获取验证码→解密数据→生成验证签名→中间校验→本地解题→最终验证。整个链路围绕anti_content、content、captcha_collect和captcha_sign四类核心参数运转，采用多层加密机制（AES+RSA）保障安全性。环境签名anti_content综合了浏览器特征、屏幕尺寸等多项环境参数，而captcha_col

2026-05-26 17:40:12 877

原创 PDD psnl_verification anti_content 生成顺序与环境校验说明

K不是明文 URL，而是从当前href再派生出来的一小段摘要值。页面 URL 变，K会跟着变但K不是直接肉眼可读的 URL 字串可以把它理解成“URL 的短摘要字段”。这一步是最容易被误解的地方。它吃进去的是压缩后的中间串不是直接吃环境字段它内部还带有长度预算 / 字符映射 / 位置处理逻辑所以最终看到的环境字段 bytes协议头deflate 压缩自定义编码多层叠加后的结果。先把字段总包做再把压缩结果转成raw再拼fTail最后走做字符级输出因此，当前看到的协议字段流。

2026-05-22 10:23:23 37

原创抖音企业号私信逆向实战：在线/离线发信加密流程 + WSS 消息监听完整梳理

摘要抖音企业号IM私信协议采用多层技术架构实现消息交互，核心流程包括：会话标识构造、ECDSA签名生成、Protobuf二进制编码、HTTP请求提交及WebSocket消息解包。关键技术点涉及64位整数Long转换、基于ECDSA的数字签名机制、Protobuf序列化协议以及Base64跨语言二进制传输方案。协议设计采用业务层与协议层分离架构，通过严格的字段一致性校验确保请求有效性。值得注意的是，签名机制采用动态生成策略，相同明文可能产生不同签名值，这属于ECDSA算法的固有特性。整体协议通过Protob

2026-05-08 16:11:45 508

原创顶象验证码全家桶技术攻略：从题型拆分到统一求解框架

从技术角度看，全家桶最重要的不是支持多少名称，而是有没有把不同题型归纳成可维护的解法体系。用统一调度管理多题型用公共预处理模块服务所有 solver根据题型选择最合适的算法路线将结果统一输出成结构化数据保持模型层、规则层、图像层相互解耦如果只盯着某一个题型，很容易把问题写死；但如果按全家桶思路设计，你得到的不是单题答案，而是一整套可扩展的求解框架。

2026-04-23 16:59:27 1399

原创 AI 逆向分析国航 AirChina FECU 参数来源并实现离线生成

本次分析的关键不是单纯“抠算法”，而是还原完整浏览器运行环境。最初离线生成错误，是因为缺少网页隐藏配置#wsyzwdbq，导致R.key为空；补齐页面配置、cookie、storage、UA、Chrome 环境后，execjs能够脱离浏览器生成正确结构的 FECU。a0_0x411f3a(url) 负责 URL 包装a0_0x56ab93 / _() 负责生成 FECU#wsyzwdbq 决定 R.key、server_time、secureFECW 决定 FECU 前缀。

2026-04-22 17:01:22 904

原创企业版抖音私信发送关键加密参数 `reuqest_sign` 逆向分析记录

本文分析了私信发送接口中的关键加密参数 reuqest_sign 的生成过程。研究发现：请求中的 token、sdk_cert、ts_sign 来自证书认证阶段的返回值，而非本地计算 reuqest_sign 是与消息内容直接相关的本地签名字段签名过程由 SecurityProxy 处理，涉及证书、CSR等安全数据交互私信发送时参与签名的字段包括：content、conversation_id、conversation_short_id 和 timestamp 签名原文按字段排序后拼接为 field=

2026-04-21 15:14:52 1129

原创验证码OpenCV 实战：干扰拼图错误矫正

从技术上看，拼接图错位校正的核心不在于代码多长，而在于有没有把问题真正拆对。接缝附近才是高价值证据区；接缝两侧必须先建立等距对应；结构连续性比颜色一致性更重要；异常区域必须被主动降权或排除；位移判断不能怕少量坏样本，必须具备稳健性。如果只用一句话概括，可以写成：拼接图错位校正，本质上是在接缝两侧建立局部连续性度量，并通过稳健的水平位移搜索恢复被打乱的空间对应关系。这也是为什么这条路线虽然不复杂，却非常适合工程落地。它没有过度泛化，而是紧紧围绕问题结构本身来设计方法。

2026-04-15 17:38:30 65 1

原创顶象 AC 纯算法迁移实战：从补环境到纯算的完整拆解

轨迹生成器时间基线生成器delta/x/y字节加密器做到这一步，轨迹就不再依赖 DOM 事件。把浏览器运行时里那些看似分散的行为，收敛成确定的字节结构、确定的随机过程和确定的加密公式。先抽包结构。再抽明文来源。再抽加密公式。最后把 DOM / 环境依赖改写成常量和纯函数。做完这四步，补环境和纯算法之间就不再是“两个完全不同的方案”，而只是同一套逻辑的两种实现方式。不要试图把浏览器搬进纯算里，而要把浏览器行为压缩成可复现的数据流。

2026-04-09 18:09:02 1763

原创验证码OpenCV 实战：定位 8 宫格中“不同风格字体”的坐标

本文介绍了一种基于OpenCV的验证码识别方法，用于定位8宫格中不同风格字体的坐标。该方法通过五个关键步骤实现：1)图像二进制解码；2)自动裁切干扰区域；3)网格切分；4)字形提取与归一化；5)混合策略异常检测。重点解决了右侧黑条干扰、字形边缘噪声等问题，采用"尺寸离群+形状离群"的双重判定策略，有效识别出与其他7个字体风格不同的目标。该方法特别适用于布局稳定但字体风格差异多样的验证码识别场景。

2026-04-08 18:14:32 96

原创验证码OpenCV 实战：如何从一组相似图标中找出“差异图标”并返回坐标

本文介绍了一种基于OpenCV的轻量级方法，用于从一组相似图标中识别并定位差异图标。该方法通过构建前景掩码、提取候选连通域、图标归一化和相似度比较四个步骤实现。首先利用高斯模糊差分和边缘检测提取前景，然后通过连通域分析获取候选区域，接着对图标进行标准化处理以统一比较基准，最后通过相似度计算找出离群图标。文章详细讲解了每个步骤的技术细节和参数选择，包括如何处理噪声干扰、图标粘连等常见问题。这种方法相比深度学习方案更加轻量高效，适用于固定场景下的视觉识别任务。

2026-04-08 16:12:51 225

原创验证码工程实战：用 KNN 自动扩充验证码标注集的工程实践

这篇文章介绍了一种利用KNN算法自动扩充验证码标注集的工程实践方法。主要内容包括：核心思路是通过小样本（40张）学习验证码的结构特征，然后自动标注大样本（3000张）关键技术点：利用验证码的结构化特点（数字+运算符+数字）将问题分解为三个分类任务采用二值化特征提取和28x28归一化处理使用1-NN算法和Hamming距离作为分类器工程优势：不依赖深度学习框架，仅使用基础库直接利用文件名作为标签源模型训练成本低，适合快速迭代扩充实际效果：小样本测试准确率达100% 可一次性完成3000张

2026-04-03 16:32:50 63 1

原创验证码OpenCV 实战：复杂栅格背景图片中的文字增强与二值化处理

本文介绍了使用OpenCV处理复杂栅格背景验证码的技术方案。针对验证码中文字与网格背景混合导致直接二值化效果差的问题，提出分步处理策略：首先将图像按网格切分，然后对每个格子单独进行字符增强处理。核心算法通过计算局部均值与标准差评分突出文字特征，并利用形态学开运算抑制长线网格干扰，最后采用自适应阈值实现二值化。该方法有效分离了文字与复杂背景，显著提升了验证码的识别效果。

2026-04-02 16:33:31 173

原创拼多多小球直径轨迹重合验证码识别

本文分析了拼多多新型验证码的实现原理与破解思路。该验证码采用Canvas绘制小球弹跳轨迹验证，主要难点在于参数还原和轨迹计算。作者通过逆向工程提取了包括弹跳段数、振幅、旋转参数等关键配置（存储在config.json），并利用Python成功模拟了验证过程。核心算法将滑块值映射为0-1区间，通过三次变换计算小球位置，最终采用斜率截距最小值比对完成验证。整个过程分为静态初始化、核心计算和动态渲染三个阶段，其中干扰元素不影响核心验证逻辑。该研究仅用于技术学习，强调严禁任何违法行为。

2026-03-18 16:03:49 1180

原创无限泛化！图标点选验证码通杀，基于关系视觉相似度的模型训练

本文探讨了图标验证码识别的技术方案，重点分析了传统孪生网络与关系视觉相似度(relsim)模型的优劣。作者指出，虽然孪生网络轻量高效，但在处理复杂图标时存在视觉特征噪声、语义解耦能力弱等局限；而relsim模型能更好地捕捉构图逻辑关系，但计算成本较高。为此，作者提出一种轻量级关系感知网络，融合了孪生网络的轻量化架构和relsim的关系感知机制，通过可学习查询令牌和多粒度对比损失，在保持效率的同时提升关系识别能力。该方案特别针对小尺寸图标优化，采用自适应权重平衡细节与关系特征，为图标验证码识别提供了一种兼顾性

2026-03-06 18:29:41 674 1

原创抖音ttwid参数逆向生成

本文分析了抖音ttwid参数的生成机制，发现其加密过程涉及jsvmp技术。ttwid由服务器响应返回，初始请求仅返回_ac_nonce，需通过二次重定向获取完整cookie。研究发现关键cookie由window.byted_acrawler生成，该函数由_$jsvmprt通过jsvmp方式产生。在补全环境（包括DOM、exports和module校验）后，可动态生成s_v_web_id等初始cookie。附上该cookie进行二次请求即可获取ttwid。本文仅提供技术思路，严禁用于违法行为。

2026-03-04 16:48:06 936 2

原创抖音登录私信发送接收接口socket逆向

本文分析了抖音私信系统的完整收发流程，重点探讨了扫码登录和消息传输的安全机制。作者指出抖音采用严格的风控策略，要求IP、环境、账号信息完全一致才能成功登录。在消息传输方面，系统采用二进制接口和WebSocket协议相结合的方式：发送消息通过POST请求实现，接收消息则使用WebSocket实时监听。文章详细解析了加密参数的生成过程，包括token、device_id和access_key等关键参数的获取方式。作者通过逆向工程定位到加密参数存储在localStorage中，并最终由登录接口返回。整个过程涉及多

2026-03-04 16:03:25 1874

四位英文带干扰，四位随机英文数字带干扰验证码

6万数字英文随机生成干扰样本，含较强噪声

300个计算题样本，计算题验证码

滑块数据集已标注，单个背景图，共300张图片

计算题数据集，共500张图片左右，已标注好，*号已用$号代替

46位验证码，共7中类型

教育机构信息数据.rar

剧本杀所有城市门店数据.rar

VRoot491292.exe

空空如也