umi-ocr识别文件夹所有文件并导入数据库

州周

已于 2024-04-11 16:39:10 修改

阅读量469

点赞数 2

文章标签： ocr 数据库

于 2024-04-05 14:28:38 首次发布

本文链接：https://blog.csdn.net/weixin_45249411/article/details/137400065

版权

本文介绍了一个Python脚本，通过调用umi-ocrAPI识别身份证图片中的信息，并将结果存储到MySQL数据库中。脚本使用了Tkinter库进行用户界面交互，包括文件夹选择和执行功能。

摘要由CSDN通过智能技术生成

最近有个需求是识别身份证所有信息。所以调用umi-ocr接口并写入mysql

import os
import glob
from time import sleep
import requests
import json
import pymysql
import tkinter as tk
from tkinter import ttk

from sympy import true


def write_to_database(image_path, response_text, db_config):
    with pymysql.connect(**db_config) as conn:
        with conn.cursor() as cursor:
            sql = "INSERT INTO image_records (path, text) VALUES (%s, %s)"
            cursor.execute(sql, (image_path, response_text))
            conn.commit()


def get_image_paths(directory, extensions=['.jpg', '.png']):
    image_paths = []
    for ext in extensions:
        pattern = os.path.join(directory, f'*{ext}')
        image_paths.extend(glob.glob(pattern))
    return image_paths


def send_http_post_request(url, data, headers=None, auth=None):
    default_headers = {'Content-Type': 'application/json'}
    if headers is not None:
        headers = {**default_headers, **headers}
    else:
        headers = default_headers
    json_data = json.dumps(data)
    response = requests.post(url, data=json_data, headers=headers, auth=auth)
    return response

def returndata(directory, db_config):
    # 使用os.walk遍历目录
    for root, dirs, files in os.walk(directory):
        for filename in files:
            sleep(0.2)
            # 构建完整的文件路径
            file_path = os.path.join(root, filename)
            # 准备发送的数据
            post_data = ["--path", file_path]
            try:
                # 发送HTTP POST请求
                response = send_http_post_request("http://127.0.0.1:1224/argv", post_data)
                # 获取响应文本并替换换行符
                response_text = response.text.replace('\n', ',').replace('\t','')
                # 将响应写入数据库
                write_to_database(file_path, response_text, db_config)
            except Exception as e:
                # 打印异常信息，或者根据需要处理异常
                print(f"Error processing file {file_path}: {e}")
    return true


def on_click():
    global entry_directory
    directory = entry_directory.get()
    db_host = '127.0.0.1'
    db_port = 3306
    db_user = 'root'
    db_password = '123456'
    db_name = 'xxxxx'

    db_config = {
        'host': db_host,
        'port': db_port,
        'user': db_user,
        'password': db_password,
        'db': db_name
    }

    status = returndata(directory, db_config)

    if status:
        window.destroy()

def main():
    global window
    window = tk.Tk()
    window.title("OCR识别导入")
    window.geometry("400x200")  # 设置窗口大小（可根据需要调整）

    # 添加标签和输入框
    label_directory = ttk.Label(window, text="请输入文件夹目录:", style="TLabel")
    label_directory.grid(row=0, column=0, padx=10, pady=(10, 5), sticky="w")

    global entry_directory
    entry_directory = ttk.Entry(window, width=30, style="TEntry")
    entry_directory.grid(row=0, column=1, padx=(0, 10), pady=(10, 5), sticky="ew")

    # 添加执行按钮
    button_execute = ttk.Button(window, text="Execute", command=on_click, style="TButton")
    button_execute.grid(row=1, column=0, columnspan=2, padx=10, pady=10, ipadx=10, sticky="ew")

    window.mainloop()

if __name__ == '__main__':
    main()

之后再利用

python -m pip install pyinstaller


python -m PyInstaller -F -w  test.py 打包成可执行程序

州周

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
umi-ocr识别文件夹所有文件并导入数据库

最近有个需求是识别身份证所有信息。所以调用umi-ocr接口并写入mysql。
复制链接

扫一扫