umi-ocr识别文件夹所有文件并导入数据库

本文介绍了一个Python脚本,通过调用umi-ocrAPI识别身份证图片中的信息,并将结果存储到MySQL数据库中。脚本使用了Tkinter库进行用户界面交互,包括文件夹选择和执行功能。
摘要由CSDN通过智能技术生成

最近有个需求是识别身份证所有信息。所以调用umi-ocr接口并写入mysql

import os
import glob
from time import sleep
import requests
import json
import pymysql
import tkinter as tk
from tkinter import ttk

from sympy import true


def write_to_database(image_path, response_text, db_config):
    with pymysql.connect(**db_config) as conn:
        with conn.cursor() as cursor:
            sql = "INSERT INTO image_records (path, text) VALUES (%s, %s)"
            cursor.execute(sql, (image_path, response_text))
            conn.commit()


def get_image_paths(directory, extensions=['.jpg', '.png']):
    image_paths = []
    for ext in extensions:
        pattern = os.path.join(directory, f'*{ext}')
        image_paths.extend(glob.glob(pattern))
    return image_paths


def send_http_post_request(url, data, headers=None, auth=None):
    default_headers = {'Content-Type': 'application/json'}
    if headers is not None:
        headers = {**default_headers, **headers}
    else:
        headers = default_headers
    json_data = json.dumps(data)
    response = requests.post(url, data=json_data, headers=headers, auth=auth)
    return response

def returndata(directory, db_config):
    # 使用os.walk遍历目录
    for root, dirs, files in os.walk(directory):
        for filename in files:
            sleep(0.2)
            # 构建完整的文件路径
            file_path = os.path.join(root, filename)
            # 准备发送的数据
            post_data = ["--path", file_path]
            try:
                # 发送HTTP POST请求
                response = send_http_post_request("http://127.0.0.1:1224/argv", post_data)
                # 获取响应文本并替换换行符
                response_text = response.text.replace('\n', ',').replace('\t','')
                # 将响应写入数据库
                write_to_database(file_path, response_text, db_config)
            except Exception as e:
                # 打印异常信息,或者根据需要处理异常
                print(f"Error processing file {file_path}: {e}")
    return true


def on_click():
    global entry_directory
    directory = entry_directory.get()
    db_host = '127.0.0.1'
    db_port = 3306
    db_user = 'root'
    db_password = '123456'
    db_name = 'xxxxx'

    db_config = {
        'host': db_host,
        'port': db_port,
        'user': db_user,
        'password': db_password,
        'db': db_name
    }

    status = returndata(directory, db_config)

    if status:
        window.destroy()

def main():
    global window
    window = tk.Tk()
    window.title("OCR识别导入")
    window.geometry("400x200")  # 设置窗口大小(可根据需要调整)

    # 添加标签和输入框
    label_directory = ttk.Label(window, text="请输入文件夹目录:", style="TLabel")
    label_directory.grid(row=0, column=0, padx=10, pady=(10, 5), sticky="w")

    global entry_directory
    entry_directory = ttk.Entry(window, width=30, style="TEntry")
    entry_directory.grid(row=0, column=1, padx=(0, 10), pady=(10, 5), sticky="ew")

    # 添加执行按钮
    button_execute = ttk.Button(window, text="Execute", command=on_click, style="TButton")
    button_execute.grid(row=1, column=0, columnspan=2, padx=10, pady=10, ipadx=10, sticky="ew")

    window.mainloop()

if __name__ == '__main__':
    main()

之后再利用

python -m pip install pyinstaller


python -m PyInstaller -F -w  test.py 打包成可执行程序

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
umi-ocr 是一种强大的批量图片转文字工具。它可以帮助我们将大量的图片文件快速转换成可编辑的文本文件。使用 umi-ocr 可以帮助我们大大提高工作效率和减少工作量。 使用 umi-ocr 进行批量图片转文字非常简单。首先,我们需要将需要转换的图片文件保存在一个文件夹中。然后,打开 umi-ocr 软件,并选择这个文件夹作为输入源。接下来,设置输出文件的保存路径,并选择要输出的文件格式,例如.txt 或.docx。一切准备就绪后,点击开始转换按钮。 umi-ocr 会自动读取文件夹中的所有图片文件,并进行图片识别和文字提取。转换过程完全自动化,我们不需要逐个处理每个图片文件umi-ocr 使用先进的光学字符识别技术,可以准确地从图片中提取出文字内容。同时,umi-ocr 还具备自动修复识别错误和校正排版的功能,可以提高转换质量。 使用 umi-ocr 进行批量图片转文字有很多应用场景。例如,我们可以将大量扫描的文件或图片转换成可编辑的文本文件,方便后续编辑和处理。此外,umi-ocr 还可以用于电子图书馆、图文数据处理、文档归档等领域。无论是个人使用还是商业场景,umi-ocr 都是一款方便、高效的工具。 总之,umi-ocr 是一款强大的批量图片转文字工具,可以帮助我们将大量图片文件快速转换成可编辑的文本文件。它使用先进的识别技术,可以高效地提取文字内容,并具备自动修复和校正排版的功能。umi-ocr 在各个领域都有广泛的应用前景,是一款非常实用的软件。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值