python批量识别图片表格数据写入到excel表格中

from PIL import Image
import pytesseract
from openpyxl import Workbook
 
def load_image(image_path):
    image = Image.open(image_path)
    return image
 
def convert_to_grayscale(image):
    return image.convert("L")
 
def extract_text(image):
    return pytesseract.image_to_string(image)
 
def extract_table_data(text):
    rows = text.strip().split("\n")
    table_data = [row.split("\t") for row in rows]
    return table_data
 
def save_as_excel(table_data, output_path):
    workbook = Workbook()
    sheet = workbook.active
 
    for row_index, row_data in enumerate(table_data, start=1):
        for column_index, cell_data in enumerate(row_data, start=1):
            sheet.cell(row=row_index, column=column_index, value=cell_data)
 
    workbook.save(output_path)
 
# 调用示例
image_path = "table_image.jpg"
output_path = "table_data.xlsx"
 
image = load_image(image_path)
grayscale_image = convert_to_grayscale(image)
text = extract_text(grayscale_image)
table_data = extract_table_data(text)
save_as_excel(table_data, output_path)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

数据服务生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值