ddddOCR，Python 的一个识别验证码的开源库

最新推荐文章于 2024-05-23 20:56:02 发布

cyberpunks

最新推荐文章于 2024-05-23 20:56:02 发布

阅读量445

点赞数 5

文章标签： python 开发语言

本文链接：https://blog.csdn.net/cyberpunks/article/details/137926028

版权

OCR（Optical Character Recognition，光学字符识别）是一项技术，用于将印刷或手写的文本转换为可编辑和可搜索的电子文档。它通过分析图像中的字符形状和结构，将其转换为机器可读的文本数据。OCR 技术在许多领域都扮演着重要的角色，包括文档管理、自动化办公、图书馆数字化、车牌识别等。

对于 OCR 文字提取，在之前他也介绍过了 Umi-OCR 这个工具，那么我们今天要分享的这个主要是来用于解决验证码相关的问题的一个开源工具。ddddocr ，作者的 github 项目地址如下：https://github.com/sml2h3/ddddocr?tab=readme-ov-file

在我们日常进行一些自动化测试相关的操作时，有时候需要输入验证码，现在市场上的验证码种类非常繁多。主流的有以下几种：

拖动滑块到指定位置的
按照顺序点击指定的文字的
输入图片里的字母+数字组合的
计算图片里的数字加减乘除结果的
手机验证码的
还有一些非人类的识别物体的（emo 了这种的）

ddddorc 主要用来解决识别图片文本内容，比如字母和汉字以及滑动滑块这种的场景那么接下来，我们就来安装和使用来试试 ddddocr 的效果怎么样。需要的环境是 Python<=3.9 版本。window，linux，mac 都支持，但是不支持 M1。只需要在终端输入 pip install ddddocr等待安装后即可使用。

接下来是使用示例：

识别图片上的文字：适用于输入图片上指定的字母或者数字等情况

import ddddocr

ocr = ddddocr.DdddOcr()
#图片的路径
with open("img.png", 'rb') as f:
    image = f.read()
res = ocr.classification(image)
print(res)

2.目标检测。适用于文字点选和图标点选。简单来说，对于点选类的验证码，可以快速的检测出图片上的文字或者图标。

import ddddocr
import cv2

det = ddddocr.DdddOcr(det=True)

with open("test.jpg", 'rb') as f:
    image = f.read()

poses = det.detection(image)
print(poses)

im = cv2.imread("test.jpg")

for box in poses:
    x1, y1, x2, y2 = box
    im = cv2.rectangle(im, (x1, y1), (x2, y2), color=(0, 0, 255), thickness=2)

cv2.imwrite("result.jpg", im)

创作不易，如果您觉得这篇文章对你有帮助，不妨给他点个赞，这将是他继续分享优质内容的动力。

cyberpunks

关注

5
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
ddddOCR，Python 的一个识别验证码的开源库

OCR（Optical Character Recognition，光学字符识别）是一项技术，用于将印刷或手写的文本转换为可编辑和可搜索的电子文档。在我们日常进行一些自动化测试相关的操作时，有时候需要输入验证码，现在市场上的验证码种类非常繁多。简单来说，对于点选类的验证码，可以快速的检测出图片上的文字或者图标。识别图片上的文字：适用于输入图片上指定的字母或者数字等情况。还有一些非人类的识别物体的（emo 了这种的）
复制链接

扫一扫