基于Pytorch的身份证及其他证件检测矫正模型应用

番茄小能手

于 2024-01-16 01:43:32 发布

阅读量1.6k

点赞数 31

分类专栏： Pytorch 文章标签： pytorch 人工智能 python

本文链接：https://blog.csdn.net/yy007h/article/details/135614249

版权

Pytorch 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文介绍了一种利用Python和PyTorch库进行身份证等证件图片自动摆正的算法，CardDetectionCorrection，以提高OCR文字识别的准确性。该方法适用于多证混贴和任意角度检测，准确率高达99%。

摘要由CSDN通过智能技术生成

前言

在做身份证和其他证件识别的时候，图片基本都不是摆正的状态，此时在进行OCR文字识别的提取文字信息的时候会出现很多误差，如何将证件摆正，再进行OCR文字识别就可以大大提高准确率。

准备工作

1、Python环境，在Python官网下载安装

2、项目代码，下载地址在文章最后

开始

以上准备工作完成后，就可以开始使用

1、下载依赖包

pip install pyaml
pip install torch
pip install opencv-python

2、编写预测代码，cpu中运行

import cv2

from core.infer import CardDetectionCorrection

card_detection_correction = CardDetectionCorrection(
    model_path="./models/card_correction/model.pt",
    config_path="./models/card_correction/config.json",
    device="cpu"
)
img = cv2.imread("images/image3.jpg")
results = card_detection_correction(img)


for i, result in enumerate(results):
    output_img = result["output_img"]
    cv2.imwrite('output/image_' + str(i) + '.jpg', output_img)

3、gpu中运行

默认使用cpu运行，如果需要在gpu中运行，首先要配置GPU环境，可通过这篇文章进行配置【Ubuntu系统配置深度学习环境之nvidia显卡驱动和cuda安装】。

安装完成后，初始化方法改成：

card_detection_correction = CardDetectionCorrection(
    model_path="./models/card_correction/model.pt",
    config_path="./models/card_correction/config.json",
    device="gpu"
)

4、运行结果展示

输入图片：

输出：

实际运行效果非常好

支持任意角度、多证等混贴场景，同时检测输入图像任意角度的多个子图区域
基于真实数据训练，满足身份证等卡证票据的检测矫正需求
支持四方向判断，准确率高达 99%

完毕！！！

模型及代码下载：基于Pytorch的身份证及其他证件检测矫正模型应用代码

番茄小能手

关注

31
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
4
评论
基于Pytorch的身份证及其他证件检测矫正模型应用

在做身份证和其他证件识别的时候，图片基本都不是摆正的状态，此时在进行OCR文字识别的提取文字信息的时候会出现很多误差，如何将证件摆正，再进行OCR文字识别就可以大大提高准确率。
复制链接

扫一扫