dddd带带弟弟OCR识别验证码

本文介绍了如何使用Python开源库ddddocr进行验证码识别。通过安装、基本使用和错误处理,详细展示了该库在处理验证码识别过程中的应用。常见错误包括缺少Microsoft Visual C++ Redistributable 2019,解决方案是安装对应版本的Redistributable。
摘要由CSDN通过智能技术生成

在 github 上找到一个开源库,而且还很强大。这个库叫 ddddocr ,
GitHub - sml2h3/ddddocr: 带带弟弟 通用验证码识别OCR pypi版

ddddorc 安装使用

安装 ddddocr

pip install ddddocr -i https://pypi.douban.com/simple

使用方法

参数说明:

Ddddocr 接受两个参数

参数名默认值说明
use_gpuFalseBool 是否使用gpu进行推理,如果该值为False则device_id不生效
device_id0int cuda设备号,目前仅支持单张显卡

classification 

参数名默认值说明
img0bytes 图片的bytes格式

单个图片的识别:

# -*- coding:utf-8 -*-
import ddddocr                       # 导入 ddddocr
ocr = ddddocr.DdddOcr()              # 实例化
with open('002.png', 'rb') as f:     # 打开图片
    img_bytes = f.read()             # 读取图片
res = ocr.classification(img_bytes)  # 识别
print(res)

多个图片识别:

# -*- coding:utf-8 -*-
import ddddocr                       # 导入 ddddocr
ocr = ddddocr.DdddOcr()
for i in range(1, 4):
    with open(str(i) + '.png', 'rb') as f:
        img_bytes = f.read()
    res = ocr.classification(img_bytes)
    print(res)

有些大小写还是不能识别出来。

封装一下:

# -*- coding:utf-8 -*-
import ddddocr
ocr = ddddocr.DdddOcr()

def ddocr(file):
    try:
        with open(file, 'rb') as f:
            img_bytes = f.read()
        res = ocr.classification(img_bytes)
        return res
    except:
        print("获取验证码失败,请继续!")

r = ddocr('3.png')
print(r)

结合抠图一起使用,即获取验证码图片,然后用dddr 识别验证码。

from selenium import webdriver
import time
from PIL import Image
import ddddocr
ocr = ddddocr.DdddOcr()


# 抠图
def matting():
    # 打开谷歌浏览器
    browser = webdriver.Chrome()
    # 打开网站首页
    # browser.get("https://v3pro.houjiemeishi.com/PC/pages/login/login.html")
    browser.get("http://192.168.139.129:8081/jpress/admin/login")
    # 网页最大化
    browser.maximize_window()
    # 登录页图片
    picture_name1 = 'login'+'.png'
    # 保存第一张截图
    browser.save_screenshot(picture_name1)
    # 定位元素
    ce = browser.find_element_by_id("captchaImg")
    # ce = browser.find_element_by_xpath('//*[@class="codeImg"]')
    # 打印元素位置、元素尺寸
    print(ce.location, ce.size)
    # 要抠验证码的图,先获取元素参数
    left = ce.location.get('x')
    top = ce.location.get('y')
    right = ce.size.get('width') + left
    height = ce.size.get('height') + top
    # 读取刚才截的第一张图
    im = Image.open(picture_name1)
    # 抠图
    img = im.crop((left, top, right, height))
    # 验证码块的图片
    picture_name2 = 'code'+'.png'
    # 保存图片
    img.save(picture_name2)
    time.sleep(5)
    browser.close()


# 通过 ddddocr 模块识别验证码
def ddocr(file):
    try:
        with open(file, 'rb') as f:
            img_bytes = f.read()
        res = ocr.classification(img_bytes)
        return res
    except:
        print("获取验证码失败,请继续!")


if __name__ == '__main__':
    print("抠图")
    matting()
    print("识别")
    code = ddocr('code.png')
    print(code)

常见错误处理

运行过程中,有可能会遇到这个问题。

ddddocr模块的项目使用pyinstaller 打包后报错 ImportError: Microsoft Visual C++ Redistributable for Visual Studio 2019 not installed on the machine.

解决办法:
安装Microsoft Visual C++ Redistributable 2019

https://aka.ms/vs/16/release/VC_redist.x64.exe

直接点击就可以下载了,下载后直接安装即可。

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值