离线视频ocr识别

sudo apt-get install libleptonica-dev libtesseract-dev
sudo apt-get install tesseract-ocr-chi-sim
python -m pip  install video-ocr

windows安装方法:
下载安装
https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-5.3.3.20231005.exe

下载

wget https://github.com/simonflueckiger/tesserocr-windows_build/releases/download/tesserocr-v2.6.0-tesseract-5.3.1/tesserocr-2.6.0-cp311-cp311-win_amd64.whl
pip install tesserocr-2.6.0-cp311-cp311-win_amd64.whl
git clone https://github.com/PinkFloyded/video-ocr.git
cd video-ocr
notepad setup.py

去掉版本依赖,修改如下:

 install_requires=[
        "tesserocr",
        "scipy",
        "opencv-python",
        "numpy",
        "tqdm",
        "click",
        "Pillow",
    ],

之后安装

python setup.py install

如果遇到

RuntimeError: Failed to init API, possibly an invalid tessdata path: ./

则需要设置环境变量TESSDATA_PREFIX为C:\Program Files\Tesseract-OCR\tessdata\

默认只能识别英文,所以要把包改掉

查看默认位置:

Python 3.10.12 (main, Jun 11 2023, 05:26:28) [GCC 11.4.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import video_ocr
>>> video_ocr.__file__
'/home/catcatyu/.local/lib/python3.10/site-packages/video_ocr.py'
>>>
nano /home/catcatyu/.local/lib/python3.10/site-packages/video_ocr.py

修改124行添加lang=chi_sim 参数。

def _ocr(frame):
    pil_image = Image.fromarray(frame.image)
    text = tesserocr.image_to_text(pil_image,lang="chi_sim") #这行
    frame.text = text
    pbar.update()
    return frame

之后使用

video-ocr --sample_rate 10  1.mp4

即可识别。
效果:

在这里插入图片描述
在这里插入图片描述

使用--sample_rate 参数可以提高精度数字越大越好

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
身份证OCR离线识别源码是一种用于识别身份证信息的程序代码。OCR(Optical Character Recognition,光学字符识别)技术可以通过图像处理和模式识别的算法,将身份证中的文字和数字转化为可供计算机处理的文本数据。 身份证OCR离线识别源码通常由以下几个主要组成部分构成: 1. 图像预处理:首先需要对身份证图像进行预处理,如调整图像的亮度、对比度和清晰度,去除噪声等,以便提高后续识别的准确性。 2. 文字和数字定位:通过图像处理算法,将身份证图像中的文字和数字定位出来,包括姓名、性别、民族、出生日期等信息。 3. 字符分割:将定位出的文字和数字进行字符分割,将其分割成一个一个的单个字符,以便后续的字符识别。 4. 字符识别:对分割出的单个字符进行识别,可以使用传统的模式匹配、神经网络或深度学习等算法来实现。识别出的字符将转化为对应的文本数据。 5. 信息整合:将识别出的字符按照身份证的格式和顺序进行整合,得到完整的身份证信息,包括姓名、性别、民族、出生日期、住址等。 身份证OCR离线识别源码的开发需要具备一定的图像处理和模式识别的知识,也可以基于开源的OCR识别引擎进行二次开发。此外,还需要大量的图像样本用于模型的训练和优化,以提高识别的准确性和稳定性。 总之,身份证OCR离线识别源码是一项涉及图像处理和模式识别的技术,通过对身份证图像进行预处理、定位、分割和识别等步骤,将图像中的文字和数字转化为计算机可处理的文本数据,从而实现对身份证信息的自动识别和提取。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值