【源码】某度贴吧验证码识别附带demo和思路

最新推荐文章于 2024-08-09 07:52:01 发布

HGS-家里蹲

最新推荐文章于 2024-08-09 07:52:01 发布

阅读量532

点赞数

分类专栏：验证码识别爬虫文章标签： python 深度学习机器学习神经网络 http

本文链接：https://blog.csdn.net/qq_42857376/article/details/107769921

版权

本文介绍了如何使用自研的简易验证码爬虫框架采集【某度贴吧】的验证码，并结合Captcha Trainer框架进行训练，达到高识别率。通过百度OCR与自定义训练，解决字符集限制问题。详细步骤包括验证码的采集、识别及训练过程。

摘要由CSDN通过智能技术生成

【某度贴吧】验证码识别

首先采集使用了【自研简易验证码爬虫框架】

一般的验证码获取流程分为三大步骤

前置请求, 获取验证码相关参数
验证码请求, 获取验证码
校验请求, 通过官网判定验证码是否正确

通过继承 Project 类实现具体的流程 utils.Project

def before_process()-> dict, 返回其他流程需要的参数字典, 通过 self.before_params访问
def captcha_process() -> Tuple[bytes, str], 返回验证码图片bytes和识别后的内容
def feedback_process() -> bool, 返回验证码反馈情况，是否正确

在 const.json 文件中补充自己的 联众账号 和 百度API 以及样本保存的路径

{
  "baidu":  {
    "app_id":  "app_id",
    "api_key": "api_key",
    "secret_key": "secret_key"
  },
  "lianzhong": {
    "username": "username",
    "password": "password"
  },
  "target_dir": "D:/Samples"
}

编写流程：

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

HGS-家里蹲

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

captcha_trainer：[验证码识别-训练]该项目基于CNNResNetDenseNet + GRULSTM + CTCCrossEntropy来实现验证码识别。该项目仅用于训练模型

02-06

1.项目介绍基于深度学习的图片验证码的解决方案-该项目能够秒杀字符粘连重叠/透视变形/模糊/噪声等各种干扰情况，解决解决城市面临的复杂的，目前也被用作其他OCR场景。该项目基于TensorFlow 1.14开发，旨在帮助中小企业或个人用户快速构建图像分类模型并进行生产环境使用，降低技术应用门的性能。面向算法工程师：提供了可扩展的结构支持，允许通过二进制码灵活方便的添加自己的设计的网络结构及其他组件。面向零基础用户：有需求？但是不会编程？时间就是金钱，学习成本太高我想白嫖。它简直为你而生！面向需求增长者：同样的类型的需求一天10个，它的替换程度让您无需复制代码一个需求，一套服务全部搞定

【真香】百度点选单字识别90%+

kerlomz的博客

08-09

768

百度点选识别，快照更新验证码识别，生成30w样本，实测单字90+。

参与评论您还未登录，请先登录后发表或查看评论

`captcha_trainer` 项目教程

最新发布

gitblog_00724的博客

08-09

1260

captcha_trainer 项目教程 captcha_trainer[验证码识别-训练] This project is based on CNN/ResNet/DenseNet+GRU/LSTM+CTC/CrossEntropy to realize verification code identification. This project is only for training th...

【CPU 60ms】极验图标点选识别

kerlomz的博客

10-19

1972

【CPU毫秒级】极验点选识别附带调用接口

qq_42857376的博客

08-02

1427

聊一聊测评机器我看到市面上大多是Yolo实现的点选服务，什么各种DLL库满天飞，被易语言中间商贱卖到几百一套，笔者白嫖了几个这样的本地识别库，果然性能是不行的，并发几个就挂了，即使用上GPU也才达到我这个服务器CPU的性能水准，有多慢用过的应该知道，或许有的人做的还达不到我CPU的水准。但是有一个很奇怪的现象：很多人就是点名只要易语言的DLL库，理由居然是DLL快一点，但是快不快取决于目标检测和图像分类模型的预测速度，使用Web服务实现或者DLL调用库实现对性能的影响几乎可以忽略不计。不排除用易语言的也

（Amazon）亚马逊GIF动态验证码识别，95识别率

kerlomz的博客

09-08

2108

亚马逊验证码识别，Amazon验证码识别，GIF验证码识别，动态验证码识别，95识别率。

易语言验证码源码,易语言验证码识别系统

08-21

易语言验证码识别系统源码系统结构:取相似度, ======窗口程序集1 || ||------_按钮1_被单击 || ||------_按钮2_被单击 || ||------__启动窗口_创建完毕 || ||------_按钮5_被单击 || ||------_按钮3_被单击

易语言源码易语言下载吧验证码识别源码.rar

02-18

本压缩包“易语言源码易语言下载吧验证码识别源码.rar”提供了易语言实现的验证码识别程序的源代码，这对于初学者了解图像处理和验证码识别技术具有很高的学习价值。 验证码（CAPTCHA）是一种自动区分计算机和人类...

易语言源码易语言总色彩验证码识别源码.rar

02-19

易语言源码易语言总色彩验证码识别源码.rar 易语言源码易语言总色彩验证码识别源码.rar 易语言源码易语言总色彩验证码识别源码.rar 易语言源码易语言总色彩验证码识别源码.rar 易语言源码易语言总色彩验证码识别...

易语言源码验证码识别程序.rar

02-23

易语言源码验证码识别程序.rar 易语言源码验证码识别程序.rar 易语言源码验证码识别程序.rar 易语言源码验证码识别程序.rar 易语言源码验证码识别程序.rar 易语言源码验证码识别程序.rar

易语言源码易语言简单验证码生成和识别源码.rar

02-21

易语言源码易语言简单验证码生成和识别源码.rar 易语言源码易语言简单验证码生成和识别源码.rar 易语言源码易语言简单验证码生成和识别源码.rar 易语言源码易语言简单验证码生成和识别源码.rar 易语言源码易语言...

深度学习解密验证码：Captcha_Trainer项目详解

gitblog_00013的博客

03-22

1057

深度学习解密验证码：Captcha_Trainer项目详解 captcha_trainer[验证码识别-训练] This project is based on CNN/ResNet/DenseNet+GRU/LSTM+CTC/CrossEntropy to realize verification code identification. This project is only for tr...

采用开源框架captcha_trainer自动识别不定长验证码

水中加点糖

10-30

3681

由于经常需要登录某系统进行测试，但系统里有验证码每次都要进行输入感觉稍微有点繁琐。为此打算采用验证码自动识别的技术来实现。据我所知，目前识别验证码主要可以有以下方式进行解决：打码平台人工识别 ocr框架自动识别 机器学习自动识别其中速度上ocr和机器学习去识别验证码的速度是最快的，但ocr需要验证码的字符很规范才能进行识别，否则也是识别不了的。而我目前想识别类似这样的验证码，那么ocr的...

【CPU 30ms】极验九宫格识别附带接口

qq_42857376的博客

08-03

1275

前言极验九宫格是如何实现的呢？大致可以分为几个步骤，把整张图片根据需求分割成10份，其中包括：小标题+9张图。直接将文本和图片一同训练即可，新鲜出炉可测试，接口如下。测试接口测评机器请求接口：请求地址 Content-Type 参数形式请求方法 http://152.136.181.66:19099/captcha/v1 application/json JSON POST 具体参数：参数名必选类型说明 ima

验证码识别captcha_trainer在windows上用tf1在CPU上部署

sinat_36234054的博客

01-06

949

1.出现以下错误ImportError: cannot import name 'loader' from 'tf2onnx' 解决办法，tf2onnx版本过高，重装低版本tf2onnx，pip install tf2onnx==1.5.1 2.再次运行python app.py后不报错，并有可视化界面 3.打包样本然后进行配置后即可训练 ...

CNN识别微博验证码

李玺

01-11

1536

captcha_trainer 是基于深度学习的图片验证码的解决方案 - 该项目能够秒杀字符粘连重叠/透视变形/模糊/噪声等各种干扰情况，足以解决市面上绝大多数复杂的验证码场景，目前也被用于其他OCR场景。...

Python简单解决验证码问题

qq_41048272的博客

10-18

893

前言原文地址： Python简单解决验证码问题最近有个需求涉及的验证码登录，尝试过许多 OCR API 都没有什么好的效果，准确率可以说约等于 0 . 当然也可能是我没找到。不过通过搜索还是让我发现了 captcha_trainer 这个项目。项目的 About ： [验证码识别-训练] This project is based on CNN/ResNet/DenseNet+GRU/LSTM+CTC/CrossEntropy to realize verification code id

pytesseract败北？轻量级muggleOCR问世，同时支持印刷字和验证码识别

【源码】某度贴吧验证码识别 附带demo和思路

【某度贴吧】验证码识别

首先采集使用了【自研简易验证码爬虫框架】

【源码】某度贴吧验证码识别附带demo和思路