基于Pytorch的身份证及其他证件检测矫正模型应用

本文介绍了一种利用Python和PyTorch库进行身份证等证件图片自动摆正的算法,CardDetectionCorrection,以提高OCR文字识别的准确性。该方法适用于多证混贴和任意角度检测,准确率高达99%。
摘要由CSDN通过智能技术生成

前言

        在做身份证和其他证件识别的时候,图片基本都不是摆正的状态,此时在进行OCR文字识别的提取文字信息的时候会出现很多误差,如何将证件摆正,再进行OCR文字识别就可以大大提高准确率。

准备工作 

1、Python环境,在Python官网下载安装

2、项目代码,下载地址在文章最后

开始

以上准备工作完成后,就可以开始使用

1、下载依赖包
pip install pyaml
pip install torch
pip install opencv-python
2、编写预测代码,cpu中运行
import cv2

from core.infer import CardDetectionCorrection

card_detection_correction = CardDetectionCorrection(
    model_path="./models/card_correction/model.pt",
    config_path="./models/card_correction/config.json",
    device="cpu"
)
img = cv2.imread("images/image3.jpg")
results = card_detection_correction(img)


for i, result in enumerate(results):
    output_img = result["output_img"]
    cv2.imwrite('output/image_' + str(i) + '.jpg', output_img)
3、gpu中运行

默认使用cpu运行,如果需要在gpu中运行,首先要配置GPU环境,可通过这篇文章进行配置【Ubuntu系统配置深度学习环境之nvidia显卡驱动和cuda安装】。

安装完成后,初始化方法改成:

card_detection_correction = CardDetectionCorrection(
    model_path="./models/card_correction/model.pt",
    config_path="./models/card_correction/config.json",
    device="gpu"
)
4、运行结果展示

输入图片:

输出:

实际运行效果非常好

  • 支持任意角度、多证等混贴场景,同时检测输入图像任意角度的多个子图区域
  • 基于真实数据训练,满足身份证等卡证票据的检测矫正需求
  • 支持四方向判断,准确率高达 99%

完毕!!!

模型及代码下载:基于Pytorch的身份证及其他证件检测矫正模型应用代码

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

番茄小能手

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值