自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

码王吴彦祖的博客

年轻人,无所畏惧!

  • 博客(164)
  • 资源 (9)
  • 收藏
  • 关注

原创 OCR在线识别网站现已上线!

由作者亲自开发的ocr识别网站哈哈,暂时汇聚了三十多种验证码模型以及算法,欢迎各路朋友去尝试,包括但不限于: - 四六位验证码 - 不定长验证码 - 计算题验证码 - 滑块验证码 - 图标点选验证码 - 文字点选验证码 - 分类选择验证码 - 其他验证码

2024-09-10 18:14:54 496 1

原创 利用PaddleOCR识别增值税发票平台验证码(开箱即用)

下面直接讲解利用paddleocr识别的思路,为什么使用paddleocr,因为paddle中集成了较好的ocr文字识别模型,开箱即用即可,废话不多说,剑指主题,识别思路步骤如下。

2023-05-25 21:50:21 3064 8

原创 如何训练创建一个聊天自动回复的微信机器人(一)

如何创建一个聊天自动回复的微信机器人(一)这里,本来打算用一个微信号来做机器人的,但是机器人有几个缺点1、如果任意一个人想使用机器人的话,那么必须添加机器人为好友才能使用测试2、基于微信识别异常微信号的自动检测,机器人很有可能被封号o(╥﹏╥)o3、现在想使用微信号做机器人的话,后端对接微信的方法大概有两种,一是使用网页版微信的API进行接入,不过现在网页版的微信已经封的差不多了,这种方法已经过时了,二是使用微信注入dll的方式来对接,不过这种方式也同样会受到微信的异常号自动检测,也会容易封号所

2021-02-22 14:19:53 6202 3

原创 树莓派4B 极简安装教程(通俗易懂)

树莓派4B 极简安装教程(通俗易懂)既然是极简,那么所需要的的工具也是极简:PS:这里树莓派使用笔记本电脑进行安装配置1、树莓派4B 主板2、8G以上tf卡3、读卡器4、typec 电源线5、网线6、笔记本电脑一台下面是成果1、tf卡写入系统用你的tf卡插入读卡器写入一个系统即可,这里自由选择你想要安装的系统树莓派镜像下载这两个或者镜像页面下面的的操作系统都可以,这两个是标准系统,黑色的NOOBS更推荐新手使用,下载好系统后使用烧录工具把系统烧录到tf卡里面就行,这里的烧录工具

2020-09-03 00:10:51 5997 2

原创 Centos7.5 服务器搭建Selenium 爬虫详细教程

Centos7.5 服务器搭建Selenium 爬虫详细教程测试成功时间2020.03.121.安装python我安装的是python3.6需要给服务器安装Python环境最新的EPEL 7仓库提供了Python3(python 3.6)的安装源,如果你使用CentOS7或更新的版本的系统你也可以按照下面的步骤很轻松的从EPEL仓库安装。安装最新版本的EPELsudo yum ins...

2020-03-12 00:35:05 1394

原创 从0搭建一个邮件服务器(用于邮件推送以及邮件群发业务)

本文讲述如何方便快捷搭建一个邮件服务器,由于本人论文以及实习公司需要,将会言简意赅的搭建一个邮件服务器来实现所需功能,以下是实现效果图

2020-02-13 01:57:49 8683 1

原创 某东不固定大小旋转验证码识别

旋转验证码基本是旋转小图到一定的角度去匹配大图的,通常的旋转验证码,中间缺口图部分大小固定,但是在某东上,大小不固定

2024-09-20 11:16:57 20

原创 顶象图标点选模型识别

顶象图标验证码识别训练

2024-09-10 17:32:22 72

原创 某验九宫格分类识别

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。这种就是最简单的分类识别了,用迁移学习resnet训练即可,下面来看成品。如有侵犯,请联系作者下架。

2024-08-22 14:08:57 102

原创 某顶象水杯验证码YOLO识别案例

处理方法其实没什么好说的,只有yolo去检测水杯即可,这里需要注意的点就是背景图可能会出现两只水杯,包含一只完整的干扰水杯,这里在标注的时候只需要标注缺口水杯即可,缺口水杯需要分成两个类,左边的缺口和右边的缺口,这里标注使用labelimg或者x-anylabeling都行,标注情况如下。全部标注完之后,由于这里的水杯缺口并不明显,所以泛化性不一定很好,这里推荐数据集使用2k张左右,模型也最好使用大模型训练,训练情况如下。注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。

2024-08-22 10:36:53 248

原创 某酷狗音乐登录js逆向wasm解析

找到加载wasm的方式后,再根根栈自然就能找到入口,使用wasm_bindgen全局函数加载wasm,然后小伙伴放到本地去补环境后经常遇到这种情况。整个异步加载wasm的过程中检测了需要涉及到canvas的环境,整个加载的代码其实小伙伴们也能找到,就是verifycode.js。涉及到非常多的webgl函数,不过这里有大佬的话,或许也可以试试直接把webgl检测删了,避免补太多环境,最终通过小四百行的环境。表面上是wasm加载失败,其实就是环境的问题,我们来看其中部分的环境代理。

2024-08-18 21:53:51 204

原创 某红书最新8.9 xs逆向更新

最新的小红书新增了很多环境检测,如果需要协议算法欢迎私信找我,其中协议用到的验证码识别和轨迹都是训练出来的,准确率达95左右。注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。如有侵犯,请联系作者下架。

2024-08-09 16:39:10 522

原创 腾讯文字点选模型识别

文字点选如何训练,之前的文章说了很多遍了,这里只放现成的模型供查看,有需要成品联系即可,下面看具体效果图。注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。如有侵犯,请联系作者下架。

2024-08-09 13:47:25 80

原创 顶象文字点选模型识别

文字点选如何训练,之前的文章说了很多遍了,下面看具体效果图。注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。如有侵犯,请联系作者下架。

2024-08-09 13:42:27 155

原创 yandex 不定长旋转验证码PPOCR识别案例

可以看到,此种验证码非常变态,旋转角度不固定,干扰背景不固定,字符长度不固定,弯曲形变都是不固定的,在人眼都很难分辨验证码的情况下,其实都是对于模型来讲,也是比较困难的哈哈,传统验证码可能小几百张就能达到很好的效果了,是因为,验证码难度比较简单,通常都是4,6位定长,但是对于模型而言,无非就是增加数据量。由于该验证码的复杂度,自己写一个rcnn或者其他模型,来优化改数据集进行训练变的尤为困难复杂,所以这里强烈推荐百度飞桨的开源模型。在得到较好的loss后,导出模型。如有侵犯,请联系作者下架。

2024-08-05 17:18:13 246

原创 某RED书旋转验证码识别(二)

可以看到,无论是古风图片还是卡通图,基本上都能找到正确角度,该方法不采用模型训练的方式,模型训练目前市面上大致都是360角度分类训练,该方法计算复杂度大,模型精度低,因为所有图像角度在细分成360度分类后,其模型很难泛化,本文方法其实不适用模型,其运行速度在高也能控制在几百毫秒以内,该速度取决于算法精度,使用计算的图像算法越复杂,图像精度越高,运行时间越长,从下图中可以看出,最长也能控制在大约300-400毫秒以内。注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。

2024-08-05 11:41:06 1089

原创 某RED书旋转验证码识别(一)

第一步,还是先将缺口图添加至背景图中,这个还是跟之前的方法一样,计算旋转掩膜,然后覆盖添加即可,然后可以看到,缺口图片是有很明显的对比度的,且这种对比度是从上往下,没有规律(跟角度没有关系),而在背景中没有这种明暗对比度的变化,那么我们将缺口图对比度调高,背景图亮度对比度调低,最后效果就是这样。因为旋转验证码能够处理的方式实在太多了,我将以处理的难度和方式依次讲解最简单到最难,到精度最高的方式,本文还是延续之前使用梯度计算的方式来计算旋转验证码。,本文中用不到此款工具,此工具将在后续的文章中展现作用。

2024-08-01 15:54:04 135

原创 某RED书旋转验证码标注工具

最近,某书的旋转验证码又更新了,在我之前的文章有讲过利用梯度幅度计算图像边缘变化,然后计算出最合适的角度,如果使用我的代码之后那么这种方法对于小红书显然失效了,具体原因我们来分析一下,先看一下缺口图和背景图。当滑动完成之后,会以当前的角度在本地生成一张正确的图片,经过批量标注后,就能得到所有图片正确的0度角,如下。注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。实现了几个简单的小功能,加载数据集目录,切换下一张,然后拖动角度进行模拟还原。

2024-08-01 15:08:48 302

原创 yandex图标点选验证码YOLOV8识别案例

可以看到,除了在原来带色彩的图标以外,还多了一个灰色的图标,经过测试呢,这张灰色的其实就是干扰项,如果说这里使用yolov8默认配置呢,其实只要不标注这种干扰项就可以了,因为有的小伙伴会做更多的数据增强来优化模型的效果,数据增强包含其中的色彩增强,所以有可能你的色彩增强,会导致目标图标和干扰图标的颜色差异化不明显,从而导致召回率不是很稳定(当然这里的干扰图标很少,所以也不会不稳定),那么在标注完经过训练后呢,map等值都达到了较高的水平。现在,我们在使用代码进行预测展示,结果如下。

2024-07-29 14:06:03 229

原创 极验图标点选YOLOv8识别案例

这也是一篇水文,毕竟做目标检测的案例教学之前我也有讲过,极验的图标点选分为很多种,这边只讲以下一种,来看数据集。这种没什么好说的,做切割,然后把透明通道去除,做分类训练,加上背景图的目标检测,一共是分类+识别模型两种。注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。大致训练了之后,map到90以上其实效果就可以了,这里附上测试代码。最后得到顺序预测结果图。

2024-07-29 13:55:13 187

原创 全网首发,识别语音验证码,准确率高达99%

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路本文的验证码网址如下,使用base64解码获得通常验证码类型都是图片组成,语音验证码的场景其实用的非常少,因为语音需要接入耳麦去听,这样整个步骤会更复杂,而且如果是在某些公共场所不能大声外放,所以语音验证码其实并不多见,如下图所示,其实本身就有图形验证码的登录场景,为什么还要做语音验证码,作者做这一块的目的一方面是有朋友驱使,另一方面我也想做更多难的事,突破自身技术,同样在过程中学习。

2024-07-19 10:34:38 312

原创 极验文字点选验证码识别

背景图就不多说了,标题图,初步一看其实非常简单,标准的字体,使用一般的开源识别模型飞桨等就能轻松识别,事实上,你将文字下载下来,通过代码查看的时候是下面这个情况。透明通道的含义如下:其中0代表完全透明(即该像素完全不可见),255代表完全不透明(即该像素完全可见),其实,这种处理方法也简单,写一个简单的遍历循环即可。这是一篇水文,识别的步骤大家都明白,那一套基本都是标注、训练、优化、预测,极验的文字点选有意思的是标题文字,看如下几张图片。将识别到标题文字排序后,与背景匹配即可。随后,图片即可恢复正常。

2024-07-17 18:11:00 316

原创 极验语序点选验证码识别(一)

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路极验文字点选验证码不必多说,很多小伙伴,借助标注工具或者打码平台标注完数据集后,使用开源的目标检测网络即可完成,欢迎收看我之前的文章:或者使用ddddocr等工具进行一阶段的目标检测后,再进行二阶段的分类识别,两种方法都有利弊,那么本文在文字点选的基础上,将介绍如何去识别文字中的语序,**这里本文先介绍第一种方法,在后续的文章中再来讲解其他思路,**下面来看一部分数据集。

2024-07-11 18:05:03 318 2

原创 某专利网专利查询接口逆向

传的参数也没有加密,那么只需要破解出缺口位置即可,经过对比了几次缺口图和背景图后,发现使用最简单的模板匹配即可做到,部分代码如下。当然,单纯携带这个token请求第一次会出现412的响应,这个是标准的瑞数加密,关于解决412响应的问题,可以参考这篇博客。注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。获得缺口位置,通过校验后,查看登录参数,发现在传入密码位置有一个加密。我们直接退出登录,回到登录界面,登录界面有一个滑块校验,如图。在跟栈之后,发现是一个标准的堆成加密。

2024-07-10 15:29:50 282

原创 某全国增值税发票查验平台 接口JS逆向

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路本文的验证码网址如下,使用base64解码获得这个平台功能没什么好说的,就是发票查验,此接口唯一的难点有两处,一是查验需要的验证码,四种颜色的文字,选择一种颜色输入,该验证码,我很早就解决了,详情见该文章那么接下来来分析一下接口加密。

2024-06-20 13:39:44 414

原创 某雨水情网站css字体样式JS逆向

可以看到,网页是直接拿到响应请求大的返回样式直接应用到前端展示上面,一般css字体加密有两种形式,一种是文字映射,另一种是结构映射,要区分是哪种模式,直接将网页上展示的正确的文字复制下来即可,例如复制“内陆河湖”四个字,复制下来发现是“㯆䎼㾤䁀”,那么这样就是第二种模式,第二种模式处理更为复杂。可以看到每个对应的文字下面有一个的对应的code码,这个code码并不是固定的,加载不同的字体文件会有不同的code码,我们打开控制台面板看下字体是如何展示的。本文网址如下,使用base64解码获得。

2024-05-31 10:54:14 207

原创 某淘宝网语义空间推理滑块验证码识别

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路如有侵犯,请联系作者下架本文只讲解大致思路,其中过程可以略显粗糙相信逛过淘宝的老铁都知道,某宝网现在的验证码是通过语义识别出需要的图标类型,并找到全部的图标,得到最大的x2值,详情见下图通过后台查看发现,问题实际上也是一个图片,那么除了目标检测的模型去识别物体位置外,还需要多做一个文字识别的模型去识别问题,话不多说,我们理一下识别步骤。

2024-05-19 00:18:16 633

原创 某票星球网图标点选验证码YOLOV8识别案例

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路如有侵犯,请联系作者下架图标点选验证码大家都不陌生了,我们来看下数据集。

2024-05-09 15:50:38 650 3

原创 某验2代609版本JS逆向

在上图位置,可以大致看到,这里暂时没有rp参数,我们先看其他参数,userresponse由加密的距离和challenge加密得到,passtime是使用的时间,这个时间由轨迹中得到,imgload可以写死,是图片加载的时间。返回去接着看q7z 和r7z 两个参数,分别调用了两个加密函数,这两个加密方法同样也可以导出,使用的AES加密,这里就不过多赘述了,先看q7z,传入了两个参数,如下。发现是这个地方生成而来,后面传的是一串随机的16位字符串,而这个正是RSA加密,RSA加密初始话的地方在如下位置。

2024-05-05 17:17:46 133

原创 某象验证码AC参数JS逆向下(目前418版本)

如上图,getMM参数是获取鼠标滑动的轨迹,获取PageX等参数再传给app参数,getMD参数是获取鼠标点击的逻辑。这个app方法将收集到的所有参数经过加密计算后赋值给ua,我们可以在这里打下断点,看下传过来的参数有哪些。在上文中,我们讲了,还原最终的代码之后,接下来解决ac参数的生成逻辑, 我们将还原之后的代码替换上去。加密的最后,落在sendTemp方法上,传过来的t也是一些环境,往上跟栈,发现逻辑其实就在这个位置。最后,将sid,x,y三个参数传入,也能得到一个很长的ac。

2024-04-11 17:43:41 134

原创 某象验证码AC参数JS逆向上(目前418版本)

因为之前定义了很多的变量,并在代码结构体中引用这些变量,导致变量非常的多,即使我们还原了字符串大数组后,阅读依然困难,所以这一步我们需要将引用的变量直接替换成之前已经定义好的值。除此之外,还涉及到其他混淆,例如return表达式混淆,十六进制等,最基本的混淆我不再一一赘述,大致原理都差不多,下面展示一下,最终还原的结果。跟进去之后,发现是混淆之后的,并且这里也只是单纯的return,说明,在前面就已经计算完成了,我们继续查找最初生成的位置。这里,虽然网站的js会变化,但我为了方便,我暂时先写死。

2024-04-11 17:30:02 273

原创 tianai行为验证码JS逆向

这里的id就是之前请求验证码的id,data就是我们需要破解的参数,继续回到之前加密的地方可以发现,加密还是同一个地方,只是这次多一次加密,加密的数据如下。接下来分析参数,backgroundImage是背景图片,是经过打乱之后的,templateImage是缺口图片,pos是还原的顺序。经测试,准确率还是蛮高的,接下来,回到网页中去查找发送参数,可以看到,发送参数比之前多了个id和data。请求拿到本地后,需要解决的参数有两个custom和ki,跟栈进去,寻找加密逻辑,发现是混淆代码。

2024-04-09 18:11:32 203 2

原创 某象最新旋转验证码角度还原

之前写过一篇文章,,但是这个文章对比现在官网已经过时了,用不了了,此篇文章用到的案例如下现在官网的案例图如下:可以看到,现在的背景图基本上只有一种类型了,对还原的要求需要做的更精细,之前会对圆图做一个去除绿色边缘的操作,现在已经行不通了,会影响到绿色的形状物体,降低还原的准确率,所以本文对新类型的验证码重新做了一个处理,下面看具体步骤。

2024-03-22 10:14:03 242

原创 某网乱序拼图验证码快速破解还原

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路本文的验证码网址如下,使用base64解码获得数据集如下,每张图片会切割成四个部分,其中打乱两个拼图的顺序,需要经过鼠标拖动交换两个图片,还原成正常的图片经过代码还原后,效果如下:并且每张图片的还原速度只有几毫秒可以看到,还原几乎百分百准确,还原的方法很简单

2024-03-18 14:23:52 271

原创 某专利网瑞数逆向爬取

下面组装content、加密js,这里展示部分代码,需要补的环境有window、navigator、location、document、div等。由于现在网上涉及到需要瑞数的解决方案,这里使用补环境的方法解决,拿到最终cookie。注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。注意,本文随时会删,如果涉及法律法规等私信我删除文章即可。本文的验证码网址如下,使用base64解码获得。使用cookie请求后拿到最终数据。打开控制台调试后,经典的瑞数反爬。

2024-03-15 10:45:02 684 2

原创 某商城网单旋验证码角度破解

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路本文的验证码网址如下,使用base64解码获得本文使用opencv的方式实现,不涉及模型训练等AI产品,下面来看实战输入一串任意号码,点击查询后,会出来几种验证码类型,有点选,滑块,还有单旋,本文只介绍单旋验证码我们将背景图和滑块图采集一点放到本地,我这里采集了30张,用于测试最终算法的准确率其实还原正确滑块的角度思路很简单,核心围绕梯度计算来解决,下面来看具体步骤。

2024-03-14 16:15:34 908

原创 某泡招聘网js逆向爬取

加密参数有sign,nonce,还有ypsign和ypnonce, 但是经过测试后发现ypsign和ypnonce可以固定,大概没有校验或者固定的也能通过校验,接下来查找参数加密的位置,搜索sign发现出来的结果有很多,懒得查找,直接搜索yp-sign,结果就只有一个。发现用的是SHA256加密,加密的字符串u也由传参加上固定字符串组成,经过测试,加密是标准加密,没有经过魔改,传的参数也在前面能够找到,那么就很简单了,接下来,整理加密逻辑,写成js代码。目标接口是search,我们观察请求参数。

2024-03-12 14:55:09 127

原创 某阿系影城网爬虫JS逆向

打开网站,发起请求后,发现请求参数没有加密,请求头中疑似存在两个加密参数bx-ua和bx-umidtoken,经过重放请求后,发现bx-umidtoken没有验证,那么本次加密的目标就是bx-ua参数,通过全局搜索后,定位在如下位置。这里传递进来的e就是加密参数了,其中e是有umidtoken和ua组合而来,这里可以搜索ua进行查询,也可以搜索umidtoken进行查询,因为这两个参数在一块,再次搜索定位后,定位到如下位置。本次逆向目标网站如下,使用base64解码获得。补齐后,就能生成对应的ua参数。

2024-03-11 16:27:19 833 2

原创 某网站AST反混淆实战

来看一下整体js代码的混淆形式,由于混淆代码太多,大概9k多行,不好全部放上来,所以我截取了部分代码做参考,最后还原的结果压缩成6k多行,删除了3千行垃圾代码(由于安全考虑,本文只会放出部分截图做参数,本文只提供反混淆的一些思路)从上述混淆代码来看,混淆的形式包括:成员变量混淆、全局函数混淆、控制流平坦化、函数花指令、十六进制混淆、二项式混淆等等,我们根据整体js代码大概的混淆逻辑来做反混淆。1、还原十六进制字符串解混淆和二项式解混淆,方便后续还原成员变量混淆和全局字符串加密函数混淆。

2024-03-07 10:26:51 424

原创 AST混淆与解混淆笔记:逗号表达式混淆

本文主要是作者记笔记为主,温故而知新,记录混淆和解混淆的代码,后期可能会更新文章细节。本次就是将return语句增加改为逗号表达式,来混淆部分阅读逻辑。

2024-02-18 13:50:32 381

300个计算题样本,计算题验证码

300个计算题样本,计算题验证码

2022-06-09

6万数字英文随机生成干扰样本,含较强噪声

6万数字英文随机生成干扰样本,含较强噪声

2022-06-09

四位英文带干扰,四位随机英文数字带干扰验证码

四位英文带干扰,四位随机英文数字带干扰验证码

2022-06-09

46位验证码,共7中类型

46位验证码,共7中类型,共4000多张图片,全部已标注好,可以用来训练4,6位验证码的数据集,非常好用

2022-04-24

计算题数据集,共500张图片左右,已标注好,*号已用$号代替

一位数字加减乘法数据集,基本全覆盖所有已出现的可能

2022-04-24

滑块数据集已标注,单个背景图,共300张图片

滑块数据集已标注,单个背景图,共300张图片

2022-04-24

教育机构信息数据.rar

教育机构信息数据,内含主要城市的主要门店信息数据,所有数据总计8万条左右

2021-12-14

剧本杀所有城市门店数据.rar

剧本杀所有城市门店数据,包含22个城市,所有数据总计十万条

2021-12-14

VRoot491292.exe

requests_html 最新哭 render js渲染浏览器

2019-08-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除